Computational Bioinformatics and Machine Learning Models to Identify the Diseasome and Neurological Disease Comorbidities
文献类型:学位论文
作者 | Md Habibur Rahman![]() |
答辩日期 | 2020-05-31 |
文献子类 | 博士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院自动化研究所 |
导师 | 彭思龙 |
关键词 | 疾病共病鉴定 生存分析 生物信息学 机器学习 2 型糖尿病 神经系统疾病 胶质母细胞瘤 通路 基因本体 蛋白质 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 在患有疾病的患者中,共病是在同一患者中同时发生的第二种(或更多)疾病。共病的存在可能使原发性疾病的标准治疗复杂化或失败。因此,与一种单一疾病的个体相比,患有疾病合并症的个体(取决于所涉及的疾病)有更高的重病或死亡风险。利用多组学、疾病基因关联(即疾病)和分子数据研究疾病共病相互作用,提高了我们对许多疾病致病机制的认识,并在诊断、预防和治疗方面取得了重大进展。然而,随着全球疾病负担的加重,疾病共病日益成为临床和生物医学领域的一个重大问题。共病相互作用的识别和表征不仅对理解复杂的病理生理学,而且对设计合理和创造性的药物治疗发展,对患者自我管理、保健利用和治疗策略都具有重要意义。 由于共同的危险因素(包括遗传、分子、环境和基于生活方式的因素),某些共病,包括癌症,更有可能发生在同一患者身上。由于非传染性疾病的病因总是呈现复杂性,其危险因素往往是重叠的,因此它们的生物学基础和导致这种共病的潜在分子机制仍不清楚。这种复杂性不仅使单个疾病的分子机制难以捉摸及研究,而且使共病相互作用更加具有挑战性。除此之外,与传统研究相比,大多数共病研究都集中在单个临床或分子表型数据的作用上,以确定疾病共病是如何相互作用的。在这项研究中,我们设计并开发了一种生物信息学和机器学习方法,可以通过利用遗传、多组分和分子水平的数据来识别共病相互作用的重要介质。我们的研究重点是基于网络和机器学习的生物信息学模型开发,以确定疾病共病。我们已经在两个不同的项目中应用了我们开发的模型。一个是2型糖尿病(T2D)和神经系统疾病(NDs)共病相互作用的鉴定,另一个是中枢神经系统(CNS)疾病(也称为NDs)和胶质母细胞瘤(一种中枢神经系统癌症) 共病相互作用的鉴定,以及这可能对癌症患者生存的影响。 我们首先提出了一种基于网络的高通量定量生物信息学流程方法,使用不可知论方法来识别与神经系统疾病进展相关的2型糖尿病分子生物标记物。我们利用来自T2D和ND患者的对照组织和受疾病影响组织的基因表达转录组数据进行比较。我们采用线性模型对这些数据集进行微阵列数据分析(LIMMA),并通过比较受影响个体和对照个体来识别差异表达基因(DEGs)。T2D和ND共有197例DEGs,其中99例上调,98例下调。这些重叠的DEGs(即在T2D和ND数据集中看到的那些DEGs)揭示了重要的细胞信号相关分子途径的参与。然后,这些被用来提取最重要的基因本体(GO)术语。通过蛋白质-蛋白质相互作用分析,确定了已识别途径中的关键或“核心”蛋白质;许多核心蛋白质以前没有被描述为在这些疾病中发挥作用。为了揭示DEGs的一些转录和转录后调控因子,我们分别使用DEG-转录因子(TF)相互作用分析和DEG-microRNAs(miRNAs)相互作用分析。我们通过gold基准数据库和文献检索对这些结果进行了验证,明确了哪些基因和途径先前与NDs或T2D相关,哪些是新的。因此,我们的转录组数据分析已经确定了NDs和T2D之间的新的潜在联系,这些联系可能是共病相互作用的基础,这些联系可能包括治疗干预的潜在目标。 最后,我们建立了机器学习模型,并利用生物信息学和机器学习的方法来识别癌症与NDs的共病性以及癌症患者的生存期限预测。胶质母细胞瘤是一种常见的恶性脑肿瘤,死亡率高,常与NDs并存。我们采用定量分析的生物信息学框架来揭示共同的基因和细胞信号通路,它们可以连接NDs和胶质母细胞瘤。我们从国家生物技术信息中心(NCBI)和癌症基因组图谱(TCGA)获得了数据集,这些数据集来自于比较正常组织和疾病/胶质母细胞瘤组织的研究。在利用我们的框架识别差异表达基因(DEGs)后,通过疾病基因关联网络、信号通路、富集分析以及蛋白质-蛋白质相互作用(PPI)网络来预测这些DEGs的功能。我们通过单变量和多变量分析,利用Cox比例风险(Cox-PH)模型和乘积极限(PL)估计,评估哪些临床因素和基因在GBM患者生存时间的确定中起重要作用。本研究共鉴定出177个DEGs(129个表达上调,48个表达下调)。其中,54个基因与患者生存率相关。疾病网络、分子途径、个体途径、蛋白质相互作用(PPI)网络和重要基因的生存分析都表明NDs可能影响胶质母细胞瘤的进展、生长或建立。本文所鉴定的共有DEGs也可能作为胶质母细胞瘤预后的生物标志物和潜在的治疗靶点。我们还通过使用标准基准数据库dbGaP、OMIM、OMIM-Expanded和文献综述,验证了我们识别的所有特征基因和途径。这些进一步证明了我们所鉴定的基因参与了胶质母细胞瘤进展的病理过程。这项工作有潜力开发新的诊断方法,并导致新的治疗设计。 |
语种 | 英语 |
目次 | |
页码 | 158 |
源URL | [http://ir.ia.ac.cn/handle/173211/39725] ![]() |
专题 | 自动化研究所_智能制造技术与系统研究中心_多维数据分析团队 |
推荐引用方式 GB/T 7714 | Md Habibur Rahman. Computational Bioinformatics and Machine Learning Models to Identify the Diseasome and Neurological Disease Comorbidities[D]. 中国科学院自动化研究所. 中国科学院大学. 2020. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。