新研究显示AI临床诊断的准确率超过了医生

作者:yunmu  于 2020-8-24 18:22 发表于 最热闹的华人社交网络--贝壳村

通用分类:健康生活

在医学领域, 特别是在非手术科室, 诊断疾病占据了医生工作的很大部分.  本月,《自然通讯》期刊上发表了来自伦敦大学和英国数字医疗公司Babylon Health的合作研究。他们把因果关系诊断疾病的方法引进AI系统,并发现由此AI的诊断准确率超过了专业医师。

具体而言,常规AI系统诊断方法,包括基于贝叶斯模型和深度学习的方法,主要是依赖于所使用数据内部的关联推理associative inference)。但是,人类在数百年的医学科学的研究中,已经发现和确定了不少疾病的因果关。例如HIV感染可引起爱滋病,流感病毒感染可引起流行性感冒等等。如果把这些人类积累的宝贵医学财富引进AI计算,或许可以增进AI的诊断水平。

研究人员使用了1671个临床病例作为该研究的基本数据,安排44名合格的专业医师,基于关联推理算法常规AI系统,以及引进因果关系的AI系统来对这些临床案例作出诊断。然后对这三者进行对比。结果医生的准确率平均为71.4%常规AI算法的为72.5%,这两者之间并没有统计学上的差别。但是,引进因果关系AI系统诊断的准确率平均为77.3%在统计学上明显优于前两者

在论文中,作者提到,因果AI系统打破了常规AI的根据症状诊断疾病的诊断方式,而是结合模仿医师使用专业知识的诊断思维,通过因果关系缩小患者可能出现状况的范围。显然,因果AI系统更加接近专业医师的诊断思维,从而提高了诊断的准确率。

例如, 如果一个有些烟龄的烟民人出现胸骨体上中段之后部位突发压榨性,闷胀性或窒息性疼痛,并且感到恶心和疲劳,同时他又患有肺气肿。按照常规AI系统的诊断方法,胸痛和和肺气肿有着很强的相关性。但是,按照已知的因果关系,该患者很可能患了心绞痛。它和肺气肿的关连是因为抽烟。经常吸烟不但可以引起心绞痛,而且可以导致肺气肿。而肺气肿和心绞痛之间没有明显的因果关系。

又如,按照常规AI系统的诊断方法,爱滋病和B型肝炎是相关的。但是,按照已知的因果关系,HIV感染引起爱滋病,HBV感染导致B型肝炎, 这是两种完全不同的病毒引起的不同疾病。之所以爱滋病和B型肝炎在统计学上是相关的,是因为HIVHBV的传播都是因为被感染者的体液接触到了含有活的HIVHBV病毒的物质(通常是液体)。也就是相同的传播途径把它们关连起来。

其实,通常的AI诊断更像一个观察性的临床流行病学研究,只不过收集的样本更大, 变量更多, 运算更快和分析得更为复杂. 如果首次观察到一些相关, 这些相关性有些是有因果关系的,但是,更多的是一种表面联系或假相,需要去粗取精,去伪存真,深入细致的工作才能接近真相。

不过, 如果这些首次观察得不到尔后的其它独立研究的一致支持. 无论是基于多高明的分析或多大的样本,最后只有一少部分被临床试验所证实。因此,如果有大样本多中心随机双盲临床试验得出的因果关系,确实应当比AI诊断关联推理更应置于优先考虑的顺序。

近年来, 医学AI研究进展最快的是医疗影像辅助诊断。比如, AI眼底筛查技术能够在30秒内识别出糖尿病视网膜病变, 高血压眼底病变, 老年性黄斑, 青光眼等一系列眼底疾病, 远远高于放射科医生的水平。又如一个成熟的影像医师需要5分钟以上对CT影像的肺结节做出诊断,人工智能只需要几秒钟就能够作出诊断. 但是, 医疗影像是比较小众的科室,不如临床诊断那么广泛.

如果该研究能够被尔后其它独立研究和多中心大样本研究所证实, 这或许会成为解决美国医生短缺的新办法.   研究预计即使是到了2025年,美国仍然短缺4万到9万名医生.  近年来, 美国医疗体系已经逐渐扩大美国医学生的数量,以及通过增加培养医生助理的途经等来改善医生的短缺。

如果这个结果被证实,假以时日, 将来会给临床医学带来革命性的变化. 到了那时, 越来越多的医生可能把精力转入临床研究, 而把更多的日常诊断事务交给AI. 从临床研究中得出的因果关系又转过来充实到AI使用的数据库中, 从而指导AI作出更为精准的诊断.  

AI之所以比专家诊断的正确率高, 很可能是因为AI能够更为一致地应用知识. 其实, 除了像新冠肺炎这种突发情况, 现在的疾病以常见病和慢性病为主. 医疗实践和医学研究是两套思路, 实践主要是运用已知的知识, 医学指南越是一致,诊断和治疗的正确率就会越高.

医学研究刚好相反,因为历史条件, 临床试验的成本和伦理等的限制, 很多医学结论并没有经过大样本多中心的临床试验的检验。因此, 现有的医学知识里会有不少错误. 医学研究的目的是发现现有知识中的问题或发明比现有疗法更为有效的治疗手段,也就是突破现在的医学指南.  因此, 这种因果关系AI并不比常规AI对医学研究更有帮助. 无论那种AI,仅仅是一种辅助工具,都要更多的人力才能在研究中找到新的因果关系。

那使用医学研究的方法来进行医疗实践行不行呢?那也不行。 尽管FDA批准的临床试验通常已经得到观察性研究和/或动物实验的有力证据,但是也只有大约10%的成功率。平均而言,这种研究对参与试验者来说是弊大于利的。所以, 即使是现有知识存在某些错误, 从统计学来说, 只有遵从医学指南才能给病人提供最好的帮助. 当然,按照程序对一小部分人进行临床研究,对于其它类似的患者和整个人类肯定是利大于弊的,  没有这些临床试验就没有现代医学的发展和进步.

参考资料

Richens JG, et al. Improving the accuracy of medical diagnosis with causal machine learning. Nature Communication 2020. https://doi.org/10.1038/s41467-020-17419-7


高兴

感动

同情

搞笑

难过

拍砖

支持
1

鲜花

刚表态过的朋友 (1 人)

评论 (0 个评论)

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

yunmu最受欢迎的博文
  1. 妙药神菜马齿苋 [2020/08]
  2. 饥不择食 鹿和菜果 [2020/09]
  3. 多强和多久的活动才能抵消一天静坐对身体的害处 [2019/04]
  4. 日本人比美国人身体活动少吗? [2019/08]
  5. 美国房子和房产税 [2021/06]
  6. 机器人会取代医生吗? [2019/07]
  7. 成年移民能把英语学到母语水平吗? [2020/09]
  8. 为什么糖化血红蛋白高于6.5%定为糖尿病但美国医师学会的控糖目标是7-8% [2019/03]
  9. 说亚洲人阴茎小是没有事实的偏见 [2021/10]
  10. 美国新冠病毒感染者概况和中国的比较类似 [2020/03]
  11. 自杀是因为心理素质太差吗 [2019/04]
  12. 德州兴起和加州减速 [2021/04]
  13. 为什么亚裔大学毕业生的优秀率低于白人毕业生 [2019/04]
  14. 多数营养补充剂和延年益寿无关 [2019/07]
  15. 遗传风险不会影响生活方式对心血管疾病的作用 [2019/08]
  16. 新冠新热点巴西青壮年死亡比例高 [2020/05]
  17. 东亚人是否对新冠病毒较为易感? [2020/02]
  18. 1918西班牙大流感及它与新冠肺炎的异同 [2020/03]
  19. 在去年12 月或9月样本中检出新冠抗体的意义 [2020/12]
  20. 拉丁裔的新冠表现和健康饽论 [2020/06]
  21. 浅谈基础疾病和新冠病情 肥胖可能不增加病亡风险 [2020/04]
  22. 如果死的是华人会是什么结局? [2020/06]
  23. 2020年美国10大死因及它们的一些关系 [2022/02]
  24. 为什么受到伤害的是华人? [2020/09]
  25. 这次大选民调比2016年的失准 [2020/11]
  26. 神经病和里根总统遇刺 [2020/09]
  27. 我们应该怒向歧视而不是躲避歧视 [2020/05]

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2013 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2023-4-11 08:11

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部