两个AI模型实现诊断到治疗全面管理

两款人工智能模型在自主医疗领域取得了显著突破，能够在疾病管理的多个环节提供支持，覆盖从早期诊断到后续治疗决策的全过程。德国的MIRA和谷歌的AMIE是这两个独立研发的系统，其表现已达到或超越了人类内科医生的平均水平，这预示着对话式AI在辅助医疗决策方面拥有巨大潜力，甚至可能对2026年世界杯期间的医疗保障提供新的思路。

MIRA由德国海德堡大学医院开发，能够接入独立的电子病历系统，访问患者的健康数据。研究人员利用了超过500例急诊科真实病例的数据来评估MIRA。结果显示，MIRA在与患者AI代理进行信息交互后，能够准确地提取并匹配病史记录。该模型拥有超过85000种诊断检测选项，并能解读结果、制定治疗计划，包括开具处方、安排手术及办理住院。在平均诊断准确率上，MIRA达到了87.8%，而由六位跨学科医生组成的专家组准确率为78.1%。研究团队也强调，未来需要更多研究来提升其准确性，并在实际临床环境中验证其应用能力。

谷歌方面则推出了AMIE，一个针对临床管理和对话流程进行优化的、基于大型语言模型构建的系统。AMIE具备对跨多次就诊的患者数据进行连续推理的能力，能够追踪疾病的演变和治疗的响应。该系统利用谷歌的Gemini技术来分析从患者处收集的信息，并确保其输出结果与最新的临床实践指南和药物目录（包含首选药物列表）保持一致。

在一项模拟临床检查的研究中，AMIE与21名全科医生在超过100个就诊场景中进行了对比，这些场景涵盖了五个医学专科领域，并且符合英国国家卫生与临床优化研究所的指导方针以及《英国医学杂志》的最佳实践。在推理能力方面，AMIE的表现与人类医生相当；而在治疗和检查的精确度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面，AMIE均表现更优。此外，在最新的药物推理基准测试中，AMIE在处理复杂病例时也超越了医生。研究团队认为，AMIE的出现标志着利用对话式AI工具协助医生进行疾病管理进入了一个新阶段。

大型语言模型在临床应用中的进展令人欣喜，尽管以往它们多侧重于特定任务。然而，全面的患者管理需要多角度的考量，包括详尽的病史收集、审慎的检查、精确的诊断、周密的治疗规划、恰当的药物剂量以及手术安排，同时还需要在多次就诊中持续监测治疗效果。如果AI代理能够胜任这些任务并有效管理，它们将成为医生的得力助手，承担日常的常规工作，甚至可能有助于缓解全球许多地区内科医生短缺的困境。