利用机器学习了解基因调控

2019年12月29日 由 KING 发表 7159 0

在这个大数据时代,人工智能已成为科学家们的盟友。例如,机器学习算法正在帮助生物学家理解控制基因功能的分子信号。鉴于最近遗传学的显着进步,我们很容易认为21世纪的科学家已经利用机器学习掌握了一种清晰、快速的方法来进行基因组序列扫描,并找出数千个基因中哪些可以表达而哪些不能表达。基因表达是基因内编码的信息产生关键产物(例如蛋白质)的过程。但是,随着开发出新算法来分析更多数据,它们也变得更加复杂且难以解释。生物学家Justin B. Kinney和Ammar Tareen设计高级机器学习算法,使生物学家更容易理解。该算法是一种人工神经网络(ANN)。受神经元在大脑中连接和分支的方式的启发,人工神经网络是高级机器学习的计算基础。尽管具有人工神经网络的名称,但它并不是专门用于研究大脑的。


Tareen和Kinney都使用人工神经网络来分析大规模平行报告基因分析(MPRA)实验方法的数据。不幸的是,根据MPRA数据塑造标准人工神经网络的方式与科学家在生命科学中提出问题的方式大不相同。这种错位意味着生物学家发现很难解释基因调控是如何发生的。现在他们开发的新方法,可以弥合计算工具与生物学家的想法之间的鸿沟。他们创建了自定义的人工神经网络,以数学方式反映了生物学中有关基因和控制它们的分子的常见概念。通过这种方式,实际上是迫使机器学习算法以生物学家可以理解的方式处理数据。


利用这些数据,生物学家可以制作出人工神经网络,以预测哪些分子在称为基因调控的过程中控制特定基因。细胞并不需要所有蛋白质。相反,它们依靠复杂的分子机制根据需要打开或关闭产生蛋白质的基因。当这些规定失效时,通常会出现疾病。


Kinney说:了解基因调控的原理通常是开发针对疾病的分子疗法的前提。以上这些努力强调了如何优化现代工业AI技术以用于生命科学。Kinney的实验室已经验证了这种用于制作定制ANN的新策略,因此正在将其应用于调查各种各样的生物系统,包括与人类疾病有关的关键基因。

欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消