使用深度学习预测与疾病相关的突变
2019年12月30日 由 KING 发表
788768
0
在过去的几年中,人工智能已成为药物开发项目等高科技领域的关键角色。人工智能工具可帮助科学家使用优化的算法来发现生物大数据背后的秘密。诸如深层神经网络之类的AI方法改善了生物和化学应用中的方式,即疾病相关蛋白的预测,新型生物标志物的发现以及小分子药物引线的从头设计。这些最先进的方法可帮助科学家更有效、更经济地开发潜在的药物。香港大学化学系孙洪哲教授领导的研究团队与美国亚利桑那州梅奥诊所的王俊文教授(前香港大学同事)合作,研究了强大的深度学习预测蛋白质中金属结合位点与疾病相关突变的方法。这是用于预测金属蛋白中与疾病相关的金属相关位点突变的第一种深度学习方法,为应对人类疾病提供了新的平台。该研究结果最近发表在顶级科学期刊《自然机器智能》上。
金属离子在人类生物系统的(病理)生理学中起着结构或功能上的关键作用。锌、铁和铜等金属对于整个生命都是必不可少的,但必须严格控制其浓度。这些生理金属离子的缺乏或过量会导致人类严重疾病。已经发现,人类基因组中的突变与不同的疾病密切相关。如果这些突变发生在DNA的编码区,它们可能会破坏蛋白质的金属结合位点,从而引发严重的人类疾病。了解蛋白质金属结合位点上与疾病相关的突变将有助于发现新药。
该团队首先整合了来自不同数据库的组学数据,以建立一个全面的培训数据集。通过从收集的数据中查看统计数据,该团队发现不同的金属具有不同的疾病关联。锌结合位点的突变在乳腺、肝脏、肾脏、免疫系统和前列腺疾病中起主要作用。相反,钙和镁结合位点的突变分别与肌肉疾病和免疫系统疾病有关。对于铁结合位点,突变与代谢疾病有关。此外,锰和铜结合位点的突变与心血管疾病有关,而后者也与神经系统疾病有关。
研究人员使用一种新颖的方法,使用基于能量的亲和力网格图从金属结合位点提取空间特征。这些空间特征已与物理化学顺序特征合并以训练模型。最终结果表明,使用空间特征可以提高预测性能,曲线下面积(AUC)为0.90,准确度为0.82。鉴于金属学和金属蛋白领域的先进技术和平台有限,建议的深度学习方法提供了一种将实验数据与生物信息学分析相集成的方法。该方法将帮助科学家预测与癌症,心血管疾病和遗传疾病等疾病相关的DNA突变。
孙教授说:“机器学习和人工智能在当前的生物和化学科学中发挥着重要作用。在我们的小组中,我们使用包括金属组学和金属岩石组学在内的综合组学方法研究了生物学和医学中的金属,我们已经产生了大量有价值的信息。使用体内、体外实验获得数据。我们现在正在开发一种基于深度学习的人工智能方法,将这些原始数据转化为有价值的知识,从而使我们能够发现疾病背后的秘密并与之抗争。我相信这种新颖的深度学习方法可以可用于我们实验室正在进行的其他项目。”