基于深度学习的小样本肿瘤CT影像分析算法研究
文献类型:学位论文
作者 | 王硕![]() |
答辩日期 | 2019-05-30 |
文献子类 | 博士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院自动化研究所 |
导师 | 田捷 |
关键词 | 计算机断层扫描(ct) 深度学习 肿瘤分割 半监督学习 预后分析 |
学位名称 | 工学博士 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 计算机断层扫描(Computed Tomography,CT)作为癌症分析中一种常用的工具,可在宏观层面观察到肿瘤的全貌及其周围组织的微环境信息;是无创伤地观察和分析肿瘤的重要途径。近年来,深度学习的迅速发展极大地改变了现有的图像分析方法。 作为一种数据驱动的自学习模型,深度学习方法需要大量的训练数据以获得较好的性能;然而,规范化的肿瘤CT影像数量通常较小,这导致了深度学习在肿瘤的CT影像分析中面临小样本量带来的问题。本文针对这一问题从三个方面提出了新的方法:1)将病人级别的肿瘤分析问题转化为体素级分类问题,进而扩充有标签数据的样本量;2)使用迁移学习方法优化卷积神经网络的训练方式,减少小样本带来的过拟合问题;3)提出半监督学习框架,有效利用无标签数据进行网络训练。本文的主要工作及贡献如下: 1、提出了基于MV-CNN和CF-CNN的体素级分类算法。针对病人级别的肿瘤CT影像数据量少的问题,首先,将病人级别的肿瘤分析问题转化为体素级别的分类问题,将肿瘤中的每一个体素点当做一个训练样本,进行样本量扩充;然后,针对体素级分类问题的特点,提出了MV-CNN和CF-CNN网络。MV-CNN可从CT影像的三个正交的视角中提取多尺度的体素图像信息。在CF-CNN中,本文提出了中心池化层,根据图像的空间位置进行自适应的非均匀池化;并使用双分支结构融合多尺度二维信息和三维信息。在训练样本的选取上,本文提出了基于分类难度的加权采样策略。在肺肿瘤分割问题中,本文提出的MV-CNN在LIDC数据集上Dice系数为77.67%,比传统的分割方法提升8%;本文提出的CF-CNN在LIDC和GDGH两个数据集中Dice系数均大于80%,比传统的图像分割方法提升大于6%,比其他已发表的深度学习模型如U-Net提升大于3%。 2、提出了面向肿瘤CT影像的迁移学习方法。针对小样本数据易导致卷积神经网络训练时陷入局部极值点的问题,首先,使用在自然图像中已经预训练好的网络的一部分权重初始化新设计的网络,然后,通过两阶段的训练方式重新在目标数据集上训练深层卷积神经网络。基于该方法,本文实现了肺癌的EGFR基因突变预测。在由241例肺癌患者组成的独立测试集中,该方法的AUC=0.81,比目前该任务中已发表的算法性能提升17%。此外,通过卷积神经网络的可视化算法,该模型可发现肿瘤中EGFR基因突变可疑度高的区域,辅助临床上组织活检时穿刺位点的选取。 3、提出了面向肿瘤CT影像的半监督学习框架。针对肿瘤的预后分析任务中有标签的数据量少的问题,使用自编码器从相对大量的无标签数据中学习特征,然后结合少量的有标签数据来提升模型的预测性能。基于此半监督学习框架,本文设计了RCAE和DenseCAE两种网络结构,并将其应用于肺癌的总生存期预测和卵巢癌的复发时间预测。在预测肺癌患者的总生存期时,该方法的C-Index=0.710,比已发表的文章中的算法性能提升8%;在预测卵巢癌患者的复发时间时,该方法的C-Index为0.713。进一步的Kaplan-Meier分析、log-rank检验、校正曲线分析均证明了该方法的有效性。 本文围绕规范化的肿瘤CT影像数据量小的问题,从扩充有标签数据、改变网络训练方式、利用无标签数据这三个方面开展了研究,提出了适用于不同场景的深度学习模型,为肺肿瘤分割、肺癌EGFR基因突变预测、肺癌总生存期预测、卵巢癌复发时间预测这些临床肿瘤分析任务提供了有效的解决方案。 |
语种 | 中文 |
页码 | 134 |
源URL | [http://ir.ia.ac.cn/handle/173211/24000] ![]() |
专题 | 毕业生_博士学位论文 自动化研究所_复杂系统管理与控制国家重点实验室 |
推荐引用方式 GB/T 7714 | 王硕. 基于深度学习的小样本肿瘤CT影像分析算法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2019. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。