【科技自立自强】西安交医学院在法医学鉴识应用基础研究领域取得系列进展

法医学领域主要任务之一就是在理解涉鉴表型分子机制的基础上,寻找具有功能效应的分子标志物作为法医学鉴识的客观评价指标。然而,复杂涉鉴表型的发生与发展涉及多个组学水平的共同作用,缺乏可靠且易于操作的多组学数据整合分析框架来获取与复杂涉鉴表型相关的非编码RNA调控轴是一个迫切需要解决的问题。近年来,XGBoost模型以强大的并行计算及缺失值数据的处理性能逐渐在机器学习领域异军突起。由于转录组数据的时空特异性以及多组学数据在不同生物样本之间的异质性,原生XGBoost模型在应用于多组学数据时存在过度拟合的问题。

针对上述问题,西安交通大学法医学院官方霖副教授联合国内外多个科研团队,开发了基于全新机器学习算法的多组学数据整合分析非编码RNA调控轴的方法(DLRAPom)。通过在常规权重基因共表达网络分析的基础上,增加了一个全新开发的机器学习模型(Optimized-XGBoost)并结合实验验证,以识别复杂涉鉴表型相关的风险标志物及非编码RNA调控轴(如下图)。

该研究创新性地提出了基于机器学习的多组学整合分析非编码RNA调控轴的新方法,在降低了多组学数据中由于生物样本异质性导致数据过度拟合的同时,量化了预测的蛋白质编码生物标志物与复杂表型之间的重要性。上述成果以“基于多组学数据识别疾病相关 lncRNA-miRNA-mRNA 调节轴的新型机器学习算法”(DLRAPom: a hybrid pipeline of Optimized XGBoost-guided integrative multiomics analysis for identifying targetable disease-related lncRNA–miRNA–mRNA regulatory axes)为题在《生物信息学简报》上在线发表。法医学院申忱和李慧宇(硕士研究生)为本论文共同第一作者,法医学院官方霖副教授为本文末尾通讯作者。本研究工作受到国家自然科学基金、司法部科技专项及科技部重点研发计划等项目资助。

与此同时,多组学数据的整合分析不仅可以系统揭示复杂表型发生与发展的调控网络与分子特征,还有助于确定多组学分子标志物,为建立相应的风险评估模型以及探索有效的监测与预警方法奠定基础。由于对整合组学分析在复杂表型研究应用中的理解和把握,官方霖副教授受邀与香港大学统计遗传学家Pak-Chung Sham教授共同撰写了题为“精神分裂症的整合组学:从遗传决定因素到临床分类和风险预测 ”(Integrative omics of schizophrenia: from genetic determinants to clinical classification and risk prediction) 的专题综述,在《分子精神病学》(Molecular Psychiatry)上在线发表,阐述了当前精神障碍研究从遗传学研究到诊疗转化研究的现状,并提出了基于多源异构生物数据开展整合生物学分析的转化研究模板。官方霖副教授和倪桐(法医学院博士研究生)为该综述的共同第一作者,香港大学Pak-Chung Sham教授为该综述通讯作者。

上一条:【科技自立自强】西安交大单文华教授团队国际智库服务成果获钱端升法学研究成果奖

下一条:【科技自立自强】国家重点研发计划“高分辨辉光放电质谱仪研制与应用”项目启动暨实施方案论证会召开