跳到内容 跳到导航

Research & Ideas

站内搜索

探索地域偏见医疗人工智能工具

从只有三个州火车患者数据最人工智能的诊断工具。

brain scans

我们如何培养我们的医疗人工智能?太多的算法依赖于来自同一国家的数据集。 |格蒂图片/ nomadsoul1

短短的几十年前,科学家并没有太多研究新的药物时,考虑的多样性。

大多数临床试验主要招收白人居住在靠近城市的研究机构,并假设任何结果将同样适用于全国其他地区。后来的研究表明,假设是错误的;积累药物的实例后来被确定为不太有效或在初始研究中代表性不足该群体引起多种副作用。

为了解决这些不公平现象,在医学研究的参与联邦政府的要求在上世纪90年代扩大,和临床试验,现在试图从研究开始招收不同人群。

但我们现在是在重复这些同样的错误的风险,因为我们开发新的技术,比如AI。来自BET356体育在线的研究人员 检查的临床应用 机器学习发现,大多数算法对数据集培训了来自患者只有三个地理区域,而且大多数国家都没有表示任何患者。

“AI算法应该反映社会,”说 阿米特kaushal在弗吉尼亚州帕洛阿尔托医院和生物工程的BET356体育在线兼职教授的主治医生。 “如果我们的AI建设为基础的工具,用于在美国的病人,作为一个领域,我们不能有数据来训练这些工具都来自地方同样屈指可数的到来。”

kaushal,随着 拉斯·奥尔特曼,生物工程,遗传学,医学的BET356体育在线教授,生物医学数据科学, 简短的朗洛茨,放射学和生物医学信息学研究的教授,研究五年间培养了深厚学习算法的诊断任务同行评议的文章的目的是协助病人护理。在我们之间。研究,其中地理起源可以被描述,他们发现大部分(71%)中使用的患者数据从加利福尼亚州,美国马萨诸塞州,或纽约训练算法。有60%完全依赖于这三个地区。 34状态并没有在所有的表示,而其它13个州贡献有限的数据。

从AI训练有素的地域,但提出了有关的算法患者在其他方面的有效性问题的研究没有暴露的不良后果。 “我们需要了解这些偏见,以及是否大量投资提出,要删除它们的影响,说:”奥特曼的副主任 BET356体育在线以人为本的人工智能.

“地理关联到相对于健康是数不胜数的事情,”奥特曼说。 “它关联到生活方式,你吃什么,你接触到的饮食;它可以关联到天气曝光,并根据,如果你住在压裂或有毒化学物质高EPA水平的地区对其他风险 - 所有这一切都与地理相关性“。

如果这些数据集被用于一种算法来诊断在美国的病人,“你可以做实际的损害不包括样品中的人。”

有限的数据也意味着有限的视野。 “数据有可用的影响,你可以在第一时间研究问题,” kaushal说。 “如果我只有从加利福尼亚,马萨诸塞州和纽约访问数据,我可以在这些地方建立算法帮助的人。但是,在其他地区是比较常见的问题甚至不会在我的雷达“。

从这项研究的外卖:都需要发展创新更大和更多样化的数据集AI算法。 “BET356体育在线一直引领着使免费提供科学的诊断数据集的方式 - 超过迄今为止的任何其他中心,说:”朗洛茨,斯坦福主任 中心在医药和成像人工智能。 “但它是昂贵的,它是不够的。资源需要在全国范围内帮助中心有助于更多样化的训练数据集。”

公众也应该怀疑,当医疗AI系统是从狭义的训练数据集的开发。而监管机构必须审查这些新的机器学习系统的训练方法。

“药一直沿着这条道路前 - 即监督,早期的临床试验并没有太多去想性别,种族或地理上的多样性,我们仍在努力解决” kaushal说。 “艾设置进入临床医学,我们不应该等到30,40年让所有的同样的错误,并再次修复。我们应该看到,这是领导和地址。前期“。

斯坦福海的使命是推进人工智能研究,教育,政策和实践,以改善人类生存条件。 学到更多.