Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?
对于一个科技周边开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?》,主要介绍了,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!
基于有限的临床数据,数百种医疗算法已被批准。科学家们正在讨论由谁来测试这些工具,以及如何最好地进行测试。
- Devin Singh 在急诊室目睹了一名儿科患者因长时间等待救治而心脏骤停,这促使他探索 AI 在缩短等待时间中的应用。
- Singh 利用了 SickKids 急诊室的分诊数据,与同事们建立了一系列 AI 模型,用于提供潜在诊断和推荐测试。
- 一项研究表明,这些模型可以加快 22.3% 的就诊速度,将每位需要进行医学检查的患者的结果处理速度加快近 3 小时。
- 然而,人工智能算法在研究中的成功只是验证此类干预措施是否会在现实生活中帮助人们的第一步。
利用机器学习医疗指令(MLMD)在急诊科(ED)自主订购测试的方法(来源:jamanetwork.com)
谁在测试医疗 AI 系统?
基于 AI 的医疗应用,例如 Singh 正在开发的应用,通常被药品监管机构视为医疗设备,包括美国 FDA 和英国药品和保健产品监管局。因此,审查和授权使用的标准通常不如药物标准严格。只有一小部分设备(可能对患者构成高风险的设备)需要临床试验数据才能获得批准。
许多人认为门槛太低了。当费城宾夕法尼亚大学的重症监护医生 Gary Weissman 审查其领域内 FDA 批准的 AI 设备时,他发现,在他确定的十种设备中,只有三种在授权中引用了已发布的数据。只有四个提到了安全评估,没有一个包括偏见评估,该评估分析该工具的结果是否对不同患者群体公平。「令人担忧的是,这些设备确实可以并且确实会影响床边护理。」他说,「患者的生命可能取决于这些决定。」
缺乏数据使得医院和医疗系统在决定是否使用这些技术时处于困境。在某些情况下,财务激励措施会发挥作用。例如,在美国,健康保险计划已经为医院使用某些医疗 AI 设备提供报销,这使得它们在经济上具有吸引力。这些机构也可能倾向于采用承诺节省成本的 AI 工具,即使它们不一定能改善患者护理。
Ouyang 说,这些激励措施可能会阻止 AI 公司投资临床试验。「对于许多商业企业来说,你可以想象,他们会更加努力地确保他们的 AI 工具可以报销。」他说。
不同市场的情况可能有所不同。例如,在英国,由政府资助的全国性健康计划可能会在医疗中心购买特定产品之前设置更高的证据门槛,英国伯明翰大学研究人工智能负责任创新的临床研究员 Xiaoxuan Liu 说,「这样,企业就有动力进行临床试验。」
一旦医院购买了人工智能产品,他们就不需要进行进一步的测试,可以像使用其他软件一样立即使用它。然而,一些机构认识到,监管部门的批准并不能保证该设备真正有益。所以他们选择自己测试。Ouyang 说,目前许多这样的努力都是由学术医疗中心进行和资助的。
阿姆斯特丹大学医学中心重症监护医学主任 Alexander Vlaar 和同一机构的麻醉师 Denise Veelo 于 2017 年开始了一项这样的尝试。他们的目标是测试一种旨在预测手术期间低血压发生的算法。这种被称为术中低血压的状况可能导致危及生命的并发症,如心肌损伤、心脏病发作和急性肾衰竭,甚至死亡。
该算法由位于加利福尼亚州的 Edwards Lifesciences 公司开发,使用动脉波形数据——急诊科或重症监护室监视器上显示的带有波峰和波谷的红线。该方法可以在低血压发生前几分钟预测到它,从而实现早期干预。
低血压预测(HYPE)试验中的参与者流量。(来源:jamanetwork.com)Vlaar、Veelo 及其同事进行了一项随机临床试验,在 60 名接受非心脏手术的患者身上测试该工具。在手术期间使用该设备的患者平均经历 8 分钟的低血压,而对照组患者平均经历近 33 分钟。
该团队进行了第二次临床试验,证实该设备与明确的治疗方案相结合,在更复杂的环境中也有效,包括心脏手术期间和重症监护室。结果尚未公布。
成功不仅仅是因为算法的精确性。麻醉师对警报的反应也很重要。因此,研究人员确保医生做好充分准备:「我们有一个诊断流程图,上面列出了收到警报时应采取的步骤。」Veelo 说。另一家机构进行的临床试验中,同样的算法未能显示出益处。在那种情况下,「当警报响起时,床边医生没有遵从指示采取行动。」Vlaar 说。
人类参与其中一个完美的算法可能会因为人类行为的变化而失败,无论是医疗保健专业人员还是接受治疗的人。
明尼苏达州罗彻斯特的梅奥诊所(Mayo Clinic)测试了一种内部开发的算法,用于检测低射血分数的心脏病,该中心的人机交互研究员 Barbara Barry 负责弥合开发人员与使用该技术的初级保健提供者之间的差距。
该工具旨在标记可能患上这种疾病高风险的个人,这种疾病可能是心力衰竭的征兆,可以治疗,但经常无法诊断。一项临床试验表明,该算法确实增加了诊断率。然而,在与提供者的对话中,Barry 发现他们希望得到进一步的指导,了解如何与患者讨论算法的结果。这导致建议,如果广泛实施该应用程序,应包括与患者沟通的重要信息的要点,以便医疗保健提供者不必每次都考虑如何进行这种对话。「这是我们从务实试验转向实施策略的一个例子。」Barry 说。
另一个可能限制某些医疗 AI 设备成功的问题是「警报疲劳」——当临床医生接触到大量 AI 生成的警告时,他们可能会对它们变得麻木。梅奥诊所家庭医学部主任 David Rushlow 表示,在测试过程中应该考虑到这一点。
「我们每天都会收到很多次有关患者可能面临风险的疾病的警报。对于忙碌的一线临床医生来说,这实际上是一项非常艰巨的任务。」他说,「我认为其中许多工具将能够帮助我们。但是,如果没有准确地引入它们,默认情况将是继续以同样的方式做事,因为我们没有足够的带宽来学习新的东西。」Rushlow 指出。
考虑偏见
测试医疗人工智能的另一个挑战是临床试验结果很难在不同人群推广。「众所周知,当人工智能算法用于与训练数据不同的数据时,它们会非常脆弱。」Liu 说。
她指出,只有当临床试验参与者代表了该工具将要使用的人群时,才能安全地推断出结果。
此外,在资源丰富的医院收集的数据上训练的算法在资源匮乏的环境中应用时可能效果不佳。例如,Google Health 团队开发了一种用于检测糖尿病视网膜病变(一种导致糖尿病患者视力丧失的疾病)的算法,理论上准确率很高。但当该工具在泰国的诊所使用时,其性能显著下降。
一项观察性研究显示,泰国诊所的照明条件导致眼部图像质量低下,从而降低了该工具的有效性。
目前,大多数医疗人工智能工具可帮助医疗保健专业人员进行筛查、诊断或制定治疗计划。患者可能并不知道这些技术正在接受测试或常规用于他们的护理,而且目前任何国家都没有要求医疗服务提供商披露这一点。
关于应该告诉患者什么有关人工智能技术的争论仍在继续。其中一些应用程序将患者同意的问题推到了开发人员关注的焦点。Singh 团队正在开发的人工智能设备就是这种情况,该设备旨在简化 SickKids 急诊室对儿童的护理。
这项技术的显著不同之处在于,它将临床医生从整个过程中移除,让孩子(或者他们的父母或监护人)成为最终用户。
「该工具的作用是获取紧急分类数据,做出预测,并让家长直接批准——是或否——是否可以对孩子进行检测。」Singh 说。这减轻了临床医生的负担,加速了整个过程。但也带来了许多前所未有的问题。如果患者出现问题,谁来负责?如果进行了不必要的检查,谁来支付费用?
「我们需要以自动化的方式获得家属的知情同意。」Singh 表示,而且同意必须是可靠和真实的。「这不能像你注册社交媒体时那样,有 20 页小字,你只需点击接受。」
在 Singh 和他的同事等待资金开始对患者进行试验的同时,该团队正在与法律专家合作,并让该国的监管机构加拿大卫生部参与审查其提案并考虑监管影响。计算机科学家、SickKids 儿童医学人工智能计划联合主席 Anna Goldenberg 表示,目前,「监管方面的情况有点像西部荒野」。
医疗机构审慎采用 AI 工具,进行自主测试。
成本因素促使研究人员和医疗机构探索替代方案。
大型医疗机构难度较小,小型机构面临更大挑战。
梅奥诊所测试 AI 工具,面向社区医疗机构使用。
健康 AI 联盟成立保障实验室,评估模型。
杜克大学提出内部测试能力,本地验证 AI 模型。
放射科医生 Nina Kottler 强调本地验证的重要性。
人为主因素需重视,确保人工智能和最终用户准确性。
参考内容:https://www.nature.com/articles/d41586-024-02675-0
终于介绍完啦!小伙伴们,这篇关于《Nature观点,人工智能在医学中的测试一片混乱,应该怎么做?》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

- 上一篇
- 豪掷超 600 万,北汽集团赠首都奥运英雄 14 辆享界 S9 Ultra 轿车

- 下一篇
- 蚂蚁集团金融多智能体框架正式开源
-
- 科技周边 · 人工智能 | 19分钟前 |
- 小米汽车订单暴跌,上周仅增8000份
- 103浏览 收藏
-
- 科技周边 · 人工智能 | 10小时前 |
- 腾讯混元3Dv2.5新版3D模型震撼发布
- 307浏览 收藏
-
- 科技周边 · 人工智能 | 11小时前 |
- Llama4震撼发布,Meta开源多模态AI霸主
- 417浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 17次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 13次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 13次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 16次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 18次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览