AI 诊断 vs 人类医生
2026 年 4 月 30 日,哈佛医学院与贝斯以色列女执事医疗中心在顶级期刊 Science 发表了 AI 临床研究里程碑。
研究设计
- 模型:OpenAI o1 推理模型
- 数据:真实急诊科电子健康记录,包含生命体征、人口统计信息和护士记录
- 对比:AI 与数百名人类医生在相同病例上进行诊断比较
- 特点:不做体格检查,纯文本信息推理——模拟急诊分诊场景
关键数据
- 基础信息诊断:AI 67% vs 医生 50-55%
- 补充信息诊断:AI 82% vs 医生 70-79%(差异不具统计学显著性)
- 治疗计划:AI 同样表现优异
行业意义
研究作者 Adam Rodman 博士表示:"这是最重要的结论——AI 能在急诊科杂乱无章的真实数据中工作。"这标志着医疗 AI 从实验室走向真实临床环境的转折点。研究团队呼吁现在应开展严格的、前瞻性的临床试验。
来源: Harvard Medical School + Science + NPR + The Guardian
链接: https://hms.harvard.edu/news/study-suggests-ai-good-enough-diagnosing-complex-medical-cases-warrant-clinical-testing