科学家们为生物学研究开发了自动机器学习系统
2023年07月10日 由 Samoyed 发表
154022
0
在一项具有突破性的研究中,麻省理工学院(MIT)的研究人员开发出了一种名为BioAutoMATED的自动化机器学习系统,可以为生物学研究生成AI模型。该研究团队由Jim Collins博士、医学工程与科学的特米尔教授领导,旨在简化生物学领域科学家和工程师构建机器学习模型的过程。这一创新系统不仅可以针对给定的数据集选择和构建适当的模型,还可以处理繁琐的数据预处理任务。通过减少所需的时间和努力,BioAutoMATED为生物科学研究人员提供了新的可能性。
对于科学和工程实验室来说,招募机器学习专家可能是一个耗时且昂贵的过程。即使有专家参与,选择仍然需要花费大量时间和精力来选择适当的模型、格式化数据集以及进行模型微调。根据谷歌关于机器学习基础的培训课程,仅数据准备和转换就可能占项目时间的80%。这个障碍通常会让研究人员望而却步,在生物学中不愿意利用机器学习技术。
BioAutoMATED是专为生物学研究而设计的自动化机器学习系统。虽然自动化机器学习(AutoML)系统仍相对较新,大多数应用集中在图像和文本识别方面,但BioAutoMATED将AutoML的能力扩展到了生物序列领域。这一点非常重要,因为生物学的基本语言是基于诸如DNA、RNA、蛋白质和糖类等序列的。
BioAutoMATED的一个关键优势是它能够探索和构建各种类型的监督式机器学习模型,包括二元分类模型、多类分类模型和回归模型。通过将多种工具整合到一个系统中,BioAutoMATED提供了比单个AutoML工具更大的搜索空间,使模型选择更加灵活准确。
传统上,在生物学和机器学习交叉研究领域进行实验一直是一项昂贵的任务。研究团队通常在确定其想法是否可行之前,往往需要对大量的数字基础设施和受过培训的人力资源进行投资。BioAutoMATED的目标是减少这些障碍,使研究人员可以自由地进行初步实验,并评估进一步实验的可行性。这样,他们可以确定是否有必要聘请机器学习专家为他们的研究构建不同的模型。
使用BioAutoMATED的好处是多方面的。首先,它极大地减少了构建生物学研究的AI模型所需的时间和精力。通常需要数周的工作现在可以在几个小时内完成。这种节省时间的作用使研究人员能够更专注于他们的核心研究目标,而不是卷入机器学习的技术细节中。
其次,BioAutoMATED特别适用于拥有较小的生物学数据集的研究团队。它可以探索更适合这类数据集的模型,以及更复杂的神经网络。这种多功能性确保研究人员能够充分利用他们所拥有的数据并获得有意义的洞察。
为了促进应用与合作,研究人员已将BioAutoMATED的代码公开在GitHub上。他们鼓励其他人改进他们的工作,并与更大的社区合作,将BioAutoMATED打造成一个为所有人提供服务的工具。通过提高认识并将生物实践与快节奏的AI-ML实践相融合,来推进生物学研究领域的发展。
BioAutoMATED代表了生物学研究领域的重大突破。通过自动化生成式AI模型的过程,这一创新系统使科学家和工程师能够利用机器学习进行研究。通过选择适当的模型和处理数据预处理,BioAutoMATED可以简化研究过程,降低生物科学研究人员的准入门槛。随着这一领域的不断发展,进行合作与探索的可能性是无限的。
来源:https://readwrite.com/scientists-develop-automated-machine-learning-system-for-biology-research/