应用昨天·金色财经
百川智能联合清华推出Baichuan-M4医疗大模型,HealthBench三项世界第一
百川智能与清华大学联合发布医疗增强大模型Baichuan-M4,在国际权威评测HealthBench上斩获三项世界第一,综合分68.6领先GPT-5.5超10分,事实性幻觉率低至3.3%。该模型展现出主动问诊的临床思维能力,SCAN-bench动态评测初诊得分接近80%。
AI Master 解读
核心事件
Baichuan-M4在HealthBench医疗评测中综合分超GPT-5.5达10分以上。
行业影响
影响分析: 1)中国医疗AI在专业评测中首次全面领先;2)极低幻觉率(3.3%)对医疗场景至关重要;3)主动问诊能力标志着AI从被动回答向主动诊断进化。
AI Master 建议
医疗AI应用者可关注Baichuan-M4的API接入,特别适合预问诊、辅助诊断和患者教育场景。
Baichuan-M4要点
| 项目 | 详情 |
|---|---|
| 开发方 | 百川智能 + 清华大学 |
| HealthBench综合分 | 68.6(领先GPT-5.5超10分) |
| 事实性幻觉率 | 3.3% |
| SCAN-bench初诊得分 | 接近80% |
| 核心能力 | 主动问诊、临床思维、极低幻觉 |