Babylon:想要建立一个个人的人工智能医生,首先要突破5个数据挑战
2019年05月13日 由 Vincent 发表
23141
0
介绍
Babylon使用人工智能来改变世界处理医疗保健的方式。在一个50%的人口无法获得基本医疗保健的世界里,我们的目标是在任何时候、任何地方为每个人带来高质量的医疗保健。
无论你是在检查你担心的症状,管理你的血糖,关注你每天的步数,还是改变你的饮食来降低心脏病的风险-我们的目标是让你通过一个应用程序来完成这一切。我们正在设计一个人工智能,根据需要提供个性化支持,包括医疗保健、紧急需求和持续支持。
这是我们的愿景,我们称之为关注圈。
图1:Babylon护理圈,包括我们的人工智能服务、虚拟服务和物理服务
建立一个能提供全方位护理的个人人工智能医生绝非易事。我们从哪里开始?
我们首先要了解我们服务的每个人(我们称他们为成员)作为一个整体。这意味着我们需要收集所有我们能收集到的关于我们的成员的健康数据。当然,为了改善他们的护理,在他们的许可下,在监管范围内。
收集数据很容易,用它做一些有用的事情却困难得多,而且我们一路上遇到了各种各样的问题。有些公司对其他数据驱动的公司比较熟悉,而另一些公司则更具异国情调,扩展了现代人工智能的边界。
以下是我们认识到的五个主要数据挑战,在我们有机会成功构建个人人工智能医生之前,我们必须破解这些挑战:
1.我们如何确定哪些数据是相关的?
2.对于有意或无意地向我们提供不准确信息的会员,我们能做些什么?
3.当不是所有成员的健康都是通过巴比伦来实现的时候,我们如何才能对他们的健康有一个全面的认识呢?
4.我们如何从自由形式的、非结构化的医学文本中提取意义?
5.我们如何确保每个需要了解巴比伦服务的人都能理解巴比伦服务生成的数据?
挑战1:我们如何确定哪些数据是相关的?
这是一个由五部分组成的博客系列的一部分,探讨了我们在构建个人人工智能医生时所面临的一些挑战。
当我们说我们的目标是给我们的会员整个关怀圈时,它真正涉及到什么?
它包括做出一系列基于证据的决定,从而得出诊断、处方、建议去医院、如何降低疾病风险的建议等。当人类做出基于证据的决定时,我们可能有很多证据需要掌握,但我们并不总是使用我们所知的一切。
让我们举一个我们都能想到的简单例子:你正要出门,正在决定是否带伞。你可能会很快看一下天气预报:如果天气预报很快就要下雨,你就带上雨伞。在做决定的时候,你可能甚至没有注意到你过滤掉了很多其他的信息,湿度、风向、紫外线指数等等。事实上,充斥着所有其他信息的显示器会使您更难找到所需的信息,并减慢您的决策速度。
同样地,将我们对成员的所有了解都反馈给医生(无论是人类还是人工智能)会压倒并减慢他们的速度。这就是为什么我们选择只关注相关数据的原因。
问题:我们如何确定哪些数据是相关的?
对于“相关性”有很多定义,但在建筑产品的上下文中有一个非常有意义的定义是:
“如果某项任务(t)增加了实现目标(g)的可能性,则(a)与该任务(t)相关,这一点由t.所暗示。”—HJ_rland&Sejer Christensen,2002年。
我们能从中得到的是:某件事是否相关取决于我们试图实现的目标。
在Babylon,我们正试图通过许多不同的产品实现许多不同的目标。
例如,在咨询过程中,一个目标是支持我们的医生做出安全、有效的临床决策。他们告诉我们他们需要知道他们的病人的症状、情况、疾病风险因素、药物和过敏原,所以我们确保他们都知道这些。
我们的健康检查产品有一套不同的目标。例如,healthcheck希望让人们将自己的健康状况与同龄人进行比较。为了支持这一目标,我们提供健康检查,包括会员的生活方式、疾病风险因素和人口统计数据。
第1课:首先明确目标,以决定什么是相关的
但仅仅决定要包括哪些数据类别是不够的。
比如说,你找医生谈你头痛得厉害。当医生问后续问题时,他们可能不会问你脚上的症状,因为他们只想收集临床上与主诉相关的数据。
我们在构建我们的人工智能医生时反映了这一逻辑。为了让我们的会员真正参与到护理中来,我们需要知道来自护理圈不同部分的数据在临床上与所提出的问题相关。
图2:确定护理范围内所有成员的历史数据点何时与当前正在考虑的情况相关
相关性的另一个维度是时间有效性。
例如,数据点是否被认为可能或不可能在感兴趣的时间点有效。回到上面的头痛例子:虽然医生可能会关心你昨晚的头部撞击,但他们不太可能认为三年前轻微的头部损伤与你目前的头痛有关。
同样,我们的人工智能也需要记住以前发生在你身上的事情,并估计这些事情仍然是真的可能性有多大。
第2课:相关性是临床针对性和时间有效性之间相互作用的函数
图3:概念必须具有高度的临床相关性和高度的时效性,才能被视为高度相关。
因此,我们缩小了具有临床相关性和时间有效性的视野,为我们的医生和人工智能提供焦点和效率。
但是我们要小心我们画线的地方。如果我们缩小范围太多,我们可能会意外地忽略可能是他们决策过程关键的信息。临床安全是我们的首要任务,因此我们宁愿包含太多的数据而不是太少。
第3课:相关措施不得影响临床安全
下周继续关注这个由5部分组成的系列文章中的第2篇博文。