机器学习算法在预测化学品的毒性方面胜过动物试验
2018年07月24日 由 浅浅 发表
716010
0
研究人员报告称,用大量化学安全性数据进行训练的机器学习软件能够很好地预测某种毒性,而这样的预测甚至可以与昂贵的动物研究结果相媲美,有时甚至准确率更高。
马里兰州巴尔的摩市约翰霍普金斯大学的毒理学家托马斯哈东说,计算机模型可以取代每年对数百万动物进行的一些标准安全研究,比如把化合物滴入兔子的眼睛,检查它们是否刺激,或者给老鼠喂食化学物质,以确定致命剂量。大数据的力量意味着我们可以制造出比许多动物实验更具有预测性的工具。
7月11日发表在Toxicological Sciences杂志上的一篇论文中,Hartung的研究小组报告说,他们的算法可以准确地预测成千上万种化学物质的毒性,这一范围比其他已发表的模型更广泛,从吸入损害到伤害到水生生态系统9种测试。
论文“draws attention to the new possibilities of big data”中,德国路德维希港化学公司巴斯夫的毒理学家Bennard van Ravenzwaay说明,“我完全相信这将成为未来毒理学的支柱。”他补充说,在政府监管机构接受计算机结果代替动物研究之前,可能需要很多年。在评估更复杂的危害时,动物试验更难以取代,例如化学物质是否会导致癌症或干扰生育能力。
数十年来,工业界和学术界一直使用计算机模型来预测毒性。这些模型通常包含分子的化学结构,了解它在体内的反应以及动物试验或体外研究的数据。公司还通过将未经测试的物质与其效果已知的其他结构或生物相似化合物进行比较来推断未经检测物质的毒性效应,这种方法称为“读取”。但Hartung和其他毒理学家说,监管机构设定了接受这些方法的高标准,并倾向于要求进行动物研究。
为了改进软件,Hartung的团队创建了一个巨大的数据库,其中包含大约10000种化学物质的信息,基于大约80万种动物测试。这些数据最初由欧洲化学品管理局(ECHA)在赫尔辛基收集,作为2007年法律REACH(化学品的注册,评估,授权和限制)的一部分,要求公司注册在欧洲销售的大多数化学品的安全信息。截至2018年5月(注册截止日期),该机构已收到超过20000种物质的信息。
ECHA将这些数据公开,但并不是以计算机能轻松分析的格式。因此,在2014年,Hartung的团队将可用数据提取到机器可读数据库中。这导致了Hartung和ECHA之间的法律纠纷,因为该机构表示,研究细节属于进行测试的公司。2017年,Hartung同意不发布自己的数据库。ECHA还在一个单独的公共文件中发布了关键的研究成果,但不是所有数据。
使用read-across方法,Hartung的软件将新化学物质与密切相关的化合物进行比较,并通过参考这些已知化学物质的特性评估毒性效应的可能性。Hartung说,实际上,该软件模拟了毒理学家如何以自动化方式调整新化学物质的大小。
Hartung的数据库分析也揭示了动物试验的不一致性:对同一化学物质的重复试验可以得到不同的结果,因为并非所有动物的反应方式都相同。因此,对于某些类型的毒性,该软件提供了比任何个体动物试验更可靠的预测,“这不可能在五年前完成。不过化学品监管向公众推出了大量的毒理学和物理性能数据。”
其他研究人员和公司也正在开发机器学习算法,尽管他们还没有发表关于他们工作的论文。化学品安全机构正在密切关注此事。4月,替代方法验证机构间协调委员会代表美国16个政府机构开发了取代动物安全测试的方法,并邀请了数十个学术和商业研究小组前往美国国立卫生研究院(NIH)。马里兰州贝塞斯达。在那里,每个团队使用自己的软件来预测先前在大鼠身上测试的40000种化学物质的“致死剂量”毒性。
结合最佳软件(包括Hartung's)产生了一种共识计算模型,Nicole Kleinstreuer认为,“这与动物试验一样好”。他负责协调这项工作并为北美达勒姆的美国国家毒理学计划开发替代毒性测试方法。今年晚些时候,美国环境保护署(EPA)计划在线发布免费下载的共识模型。
在历史性的2016年立法赋予EPA权力之后,美国代理商特别热衷于推广非动物试验方法,以确保化学品在进入市场之前被证明是安全的。上个月,EPA发布了一项战略计划,以推广包括软件在内的无动物测试方法。
该机构的计算评估负责人Mike Rasenberg表示,在欧盟,ECHA还鼓励公司通过使用读取和基于实验室细胞分析的方法来避免动物试验。
Rasenberg表示,新论文表明了一项很好的举措,但科学地说,还有很多研究要做。“没有人想要用动物测试,但我们还不能用计算机做所有的毒理学预测。”