基于动态采样和迁移学习的疾病预测模型
文献类型:期刊论文
作者 | 胡满满5; 陈旭5; 孙毓忠5; 沈曦5; 王晓青7; 余天洋1; 梅御东5; 肖立5; 程伟3; 杨杰4 |
刊名 | 计算机学报
![]() |
出版日期 | 2019 |
卷号 | 42.0期号:010页码:2339 |
关键词 | 疾病预测 迁移学习 动态采样 卷积神经网络 |
ISSN号 | 0254-4164 |
英文摘要 | 基于门诊病历临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.主流疾病预测模型将门诊病历转化为医学特征集合,将诊断结果作为输出标签,在此基础上利用机器学习算法训练疾病预测模型.不同疾病发病率的差异性导致医学样本具有不均衡、小样本特点,难以训练高效、准确的疾病预测模型.采样技术是目前解决样本不均衡问题的常用手段,其主要采用一定的策略生成均衡训练集,在均衡训练集上训练疾病预测模型,但是采样技术独立训练不同疾病的预测模型,没有考虑不同疾病模型之间的知识迁移性,限制了模型效果.迁移学习可以实现相似任务之间的知识迁移,如果将迁移学习运用到疾病预测模型训练过程中,在已有疾病诊断模型的基础上,训练新型疾病预测模型.受此启发,本文提出了基于动态采样和迁移学习的疾病预测模型,首先在多数类疾病上训练疾病预测模型,然后在此基础上训练少数类疾病预测模型,以实现不同疾病预测模型间的知识迁移.特别地,针对主流模型将疾病门诊病历转化为特征集合丢失文本信息的问题,本文提出了一种基于卷积神经网络的疾病预测模型,利用卷积神经网络提取语义信息;针对疾病模型知识迁移问题和小样本疾病训练问题,本文引入动态采样技术以构造均衡数据集,利用模型在不同样本上的预测结果来动态更新样本采样概率,目的是确保模型可以更多地关注错误分类样本和分类置信度不高的样本,从而提高预测模型的效果.本文在收集的门诊病历上进行了实验评估,实验结果表明,相对于目前主流疾病预测模型,本文提出的基于动态采样和迁移学习的疾病预测模型在准确率、召回率和F 1值上取得了重要的提升,尤其是召回率的提升具有十分重要的意义. |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/31044] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.南昌大学 2.中国人民解放军联勤保障部队第九八三医院信息科 3.中国中医科学院西苑医院 4.中国中医科学院 5.中国科学院计算技术研究所 6.中国科学院研究生院 7.首都医科大学 |
推荐引用方式 GB/T 7714 | 胡满满,陈旭,孙毓忠,等. 基于动态采样和迁移学习的疾病预测模型[J]. 计算机学报,2019,42.0(010):2339. |
APA | 胡满满.,陈旭.,孙毓忠.,沈曦.,王晓青.,...&杨焱.(2019).基于动态采样和迁移学习的疾病预测模型.计算机学报,42.0(010),2339. |
MLA | 胡满满,et al."基于动态采样和迁移学习的疾病预测模型".计算机学报 42.0.010(2019):2339. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。