当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?

Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?

来源:机器之心 2024-08-23 19:19:38 0浏览 收藏

对于一个科技周边开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?》,主要介绍了,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!

Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?

编辑 | ScienceAI

基于有限的临床数据,数百种医疗算法已被批准。科学家们正在讨论由谁来测试这些工具,以及如何最好地进行测试。

  1. Devin Singh 在急诊室目睹了一名儿科患者因长时间等待救治而心脏骤停,这促使他探索 AI 在缩短等待时间中的应用。
  2. Singh 利用了 SickKids 急诊室的分诊数据,与同事们建立了一系列 AI 模型,用于提供潜在诊断和推荐测试。
  3. 一项研究表明,这些模型可以加快 22.3% 的就诊速度,将每位需要进行医学检查的患者的结果处理速度加快近 3 小时。
  4. 然而,人工智能算法在研究中的成功只是验证此类干预措施是否会在现实生活中帮助人们的第一步。

    Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?

    利用机器学习医疗指令(MLMD)在急诊科(ED)自主订购测试的方法(来源:jamanetwork.com)

谁在测试医疗 AI 系统?

基于 AI 的医疗应用,例如 Singh 正在开发的应用,通常被药品监管机构视为医疗设备,包括美国 FDA 和英国药品和保健产品监管局。因此,审查和授权使用的标准通常不如药物标准严格。只有一小部分设备(可能对患者构成高风险的设备)需要临床试验数据才能获得批准。

许多人认为门槛太低了。当费城宾夕法尼亚大学的重症监护医生 Gary Weissman 审查其领域内 FDA 批准的 AI 设备时,他发现,在他确定的十种设备中,只有三种在授权中引用了已发布的数据。只有四个提到了安全评估,没有一个包括偏见评估,该评估分析该工具的结果是否对不同患者群体公平。「令人担忧的是,这些设备确实可以并且确实会影响床边护理。」他说,「患者的生命可能取决于这些决定。」

缺乏数据使得医院和医疗系统在决定是否使用这些技术时处于困境。在某些情况下,财务激励措施会发挥作用。例如,在美国,健康保险计划已经为医院使用某些医疗 AI 设备提供报销,这使得它们在经济上具有吸引力。这些机构也可能倾向于采用承诺节省成本的 AI 工具,即使它们不一定能改善患者护理。

Ouyang 说,这些激励措施可能会阻止 AI 公司投资临床试验。「对于许多商业企业来说,你可以想象,他们会更加努力地确保他们的 AI 工具可以报销。」他说。

不同市场的情况可能有所不同。例如,在英国,由政府资助的全国性健康计划可能会在医疗中心购买特定产品之前设置更高的证据门槛,英国伯明翰大学研究人工智能负责任创新的临床研究员 Xiaoxuan Liu 说,「这样,企业就有动力进行临床试验。」

一旦医院购买了人工智能产品,他们就不需要进行进一步的测试,可以像使用其他软件一样立即使用它。然而,一些机构认识到,监管部门的批准并不能保证该设备真正有益。所以他们选择自己测试。Ouyang 说,目前许多这样的努力都是由学术医疗中心进行和资助的。

阿姆斯特丹大学医学中心重症监护医学主任 Alexander Vlaar 和同一机构的麻醉师 Denise Veelo 于 2017 年开始了一项这样的尝试。他们的目标是测试一种旨在预测手术期间低血压发生的算法。这种被称为术中低血压的状况可能导致危及生命的并发症,如心肌损伤、心脏病发作和急性肾衰竭,甚至死亡。

该算法由位于加利福尼亚州的 Edwards Lifesciences 公司开发,使用动脉波形数据——急诊科或重症监护室监视器上显示的带有波峰和波谷的红线。该方法可以在低血压发生前几分钟预测到它,从而实现早期干预。

Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?


低血压预测(HYPE)试验中的参与者流量。(来源:jamanetwork.com)Vlaar、Veelo 及其同事进行了一项随机临床试验,在 60 名接受非心脏手术的患者身上测试该工具。在手术期间使用该设备的患者平均经历 8 分钟的低血压,而对照组患者平均经历近 33 分钟。
该团队进行了第二次临床试验,证实该设备与明确的治疗方案相结合,在更复杂的环境中也有效,包括心脏手术期间和重症监护室。结果尚未公布。
成功不仅仅是因为算法的精确性。麻醉师对警报的反应也很重要。因此,研究人员确保医生做好充分准备:「我们有一个诊断流程图,上面列出了收到警报时应采取的步骤。」Veelo 说。另一家机构进行的临床试验中,同样的算法未能显示出益处。在那种情况下,「当警报响起时,床边医生没有遵从指示采取行动。」Vlaar 说。
人类参与其中一个完美的算法可能会因为人类行为的变化而失败,无论是医疗保健专业人员还是接受治疗的人。
明尼苏达州罗彻斯特的梅奥诊所(Mayo Clinic)测试了一种内部开发的算法,用于检测低射血分数的心脏病,该中心的人机交互研究员 Barbara Barry 负责弥合开发人员与使用该技术的初级保健提供者之间的差距。
该工具旨在标记可能患上这种疾病高风险的个人,这种疾病可能是心力衰竭的征兆,可以治疗,但经常无法诊断。一项临床试验表明,该算法确实增加了诊断率。然而,在与提供者的对话中,Barry 发现他们希望得到进一步的指导,了解如何与患者讨论算法的结果。这导致建议,如果广泛实施该应用程序,应包括与患者沟通的重要信息的要点,以便医疗保健提供者不必每次都考虑如何进行这种对话。「这是我们从务实试验转向实施策略的一个例子。」Barry 说。
另一个可能限制某些医疗 AI 设备成功的问题是「警报疲劳」——当临床医生接触到大量 AI 生成的警告时,他们可能会对它们变得麻木。梅奥诊所家庭医学部主任 David Rushlow 表示,在测试过程中应该考虑到这一点。
「我们每天都会收到很多次有关患者可能面临风险的疾病的警报。对于忙碌的一线临床医生来说,这实际上是一项非常艰巨的任务。」他说,「我认为其中许多工具将能够帮助我们。但是,如果没有准确地引入它们,默认情况将是继续以同样的方式做事,因为我们没有足够的带宽来学习新的东西。」Rushlow 指出。
考虑偏见
测试医疗人工智能的另一个挑战是临床试验结果很难在不同人群推广。「众所周知,当人工智能算法用于与训练数据不同的数据时,它们会非常脆弱。」Liu 说。
她指出,只有当临床试验参与者代表了该工具将要使用的人群时,才能安全地推断出结果。
此外,在资源丰富的医院收集的数据上训练的算法在资源匮乏的环境中应用时可能效果不佳。例如,Google Health 团队开发了一种用于检测糖尿病视网膜病变(一种导致糖尿病患者视力丧失的疾病)的算法,理论上准确率很高。但当该工具在泰国的诊所使用时,其性能显著下降。
一项观察性研究显示,泰国诊所的照明条件导致眼部图像质量低下,从而降低了该工具的有效性。

Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?

患者同意

目前,大多数医疗人工智能工具可帮助医疗保健专业人员进行筛查、诊断或制定治疗计划。患者可能并不知道这些技术正在接受测试或常规用于他们的护理,而且目前任何国家都没有要求医疗服务提供商披露这一点。

关于应该告诉患者什么有关人工智能技术的争论仍在继续。其中一些应用程序将患者同意的问题推到了开发人员关注的焦点。Singh 团队正在开发的人工智能设备就是这种情况,该设备旨在简化 SickKids 急诊室对儿童的护理。

这项技术的显著不同之处在于,它将临床医生从整个过程中移除,让孩子(或者他们的父母或监护人)成为最终用户。

「该工具的作用是获取紧急分类数据,做出预测,并让家长直接批准——是或否——是否可以对孩子进行检测。」Singh 说。这减轻了临床医生的负担,加速了整个过程。但也带来了许多前所未有的问题。如果患者出现问题,谁来负责?如果进行了不必要的检查,谁来支付费用?

「我们需要以自动化的方式获得家属的知情同意。」Singh 表示,而且同意必须是可靠和真实的。「这不能像你注册社交媒体时那样,有 20 页小字,你只需点击接受。」

在 Singh 和他的同事等待资金开始对患者进行试验的同时,该团队正在与法律专家合作,并让该国的监管机构加拿大卫生部参与审查其提案并考虑监管影响。计算机科学家、SickKids 儿童医学人工智能计划联合主席 Anna Goldenberg 表示,目前,「监管方面的情况有点像西部荒野」。

Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?

寻找解决方案

医疗机构审慎采用 AI 工具,进行自主测试。
成本因素促使研究人员和医疗机构探索替代方案。
大型医疗机构难度较小,小型机构面临更大挑战。
梅奥诊所测试 AI 工具,面向社区医疗机构使用。
健康 AI 联盟成立保障实验室,评估模型。
杜克大学提出内部测试能力,本地验证 AI 模型。
放射科医生 Nina Kottler 强调本地验证的重要性。
人为主因素需重视,确保人工智能和最终用户准确性。

参考内容:https://www.nature.com/articles/d41586-024-02675-0

终于介绍完啦!小伙伴们,这篇关于《Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
豪掷超 600 万,北汽集团赠首都奥运英雄 14 辆享界 S9 Ultra 轿车豪掷超 600 万,北汽集团赠首都奥运英雄 14 辆享界 S9 Ultra 轿车
上一篇
豪掷超 600 万,北汽集团赠首都奥运英雄 14 辆享界 S9 Ultra 轿车
蚂蚁集团金融多智能体框架正式开源
下一篇
蚂蚁集团金融多智能体框架正式开源
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 茅茅虫AIGC检测:精准识别AI生成内容,保障学术诚信
    茅茅虫AIGC检测
    茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
    96次使用
  • 赛林匹克平台:科技赛事聚合,赋能AI、算力、量子计算创新
    赛林匹克平台(Challympics)
    探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
    100次使用
  • SEO  笔格AIPPT:AI智能PPT制作,免费生成,高效演示
    笔格AIPPT
    SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
    106次使用
  • 稿定PPT:在线AI演示设计,高效PPT制作工具
    稿定PPT
    告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
    101次使用
  • Suno苏诺中文版:AI音乐创作平台,人人都是音乐家
    Suno苏诺中文版
    探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
    99次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码