两款人工智能模型在自主医疗领域取得了显著突破,能够在疾病管理的多个环节提供支持,覆盖从早期诊断到后续治疗决策的全过程。德国的MIRA和谷歌的AMIE是这两个独立研发的系统,其表现已达到或超越了人类内科医生的平均水平,这预示着对话式AI在辅助医疗决策方面拥有巨大潜力,甚至可能对2026年世界杯期间的医疗保障提供新的思路。

MIRA由德国海德堡大学医院开发,能够接入独立的电子病历系统,访问患者的健康数据。研究人员利用了超过500例急诊科真实病例的数据来评估MIRA。结果显示,MIRA在与患者AI代理进行信息交互后,能够准确地提取并匹配病史记录。该模型拥有超过85000种诊断检测选项,并能解读结果、制定治疗计划,包括开具处方、安排手术及办理住院。在平均诊断准确率上,MIRA达到了87.8%,而由六位跨学科医生组成的专家组准确率为78.1%。研究团队也强调,未来需要更多研究来提升其准确性,并在实际临床环境中验证其应用能力。

谷歌方面则推出了AMIE,一个针对临床管理和对话流程进行优化的、基于大型语言模型构建的系统。AMIE具备对跨多次就诊的患者数据进行连续推理的能力,能够追踪疾病的演变和治疗的响应。该系统利用谷歌的Gemini技术来分析从患者处收集的信息,并确保其输出结果与最新的临床实践指南和药物目录(包含首选药物列表)保持一致。

在一项模拟临床检查的研究中,AMIE与21名全科医生在超过100个就诊场景中进行了对比,这些场景涵盖了五个医学专科领域,并且符合英国国家卫生与临床优化研究所的指导方针以及《英国医学杂志》的最佳实践。在推理能力方面,AMIE的表现与人类医生相当;而在治疗和检查的精确度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面,AMIE均表现更优。此外,在最新的药物推理基准测试中,AMIE在处理复杂病例时也超越了医生。研究团队认为,AMIE的出现标志着利用对话式AI工具协助医生进行疾病管理进入了一个新阶段。

大型语言模型在临床应用中的进展令人欣喜,尽管以往它们多侧重于特定任务。然而,全面的患者管理需要多角度的考量,包括详尽的病史收集、审慎的检查、精确的诊断、周密的治疗规划、恰当的药物剂量以及手术安排,同时还需要在多次就诊中持续监测治疗效果。如果AI代理能够胜任这些任务并有效管理,它们将成为医生的得力助手,承担日常的常规工作,甚至可能有助于缓解全球许多地区内科医生短缺的困境。