应用昨天·金色财经

百川智能联合清华推出Baichuan-M4医疗大模型,HealthBench三项世界第一

百川智能与清华大学联合发布医疗增强大模型Baichuan-M4,在国际权威评测HealthBench上斩获三项世界第一,综合分68.6领先GPT-5.5超10分,事实性幻觉率低至3.3%。该模型展现出主动问诊的临床思维能力,SCAN-bench动态评测初诊得分接近80%。

AI Master 解读

核心事件

Baichuan-M4在HealthBench医疗评测中综合分超GPT-5.5达10分以上。

行业影响

影响分析: 1)中国医疗AI在专业评测中首次全面领先;2)极低幻觉率(3.3%)对医疗场景至关重要;3)主动问诊能力标志着AI从被动回答向主动诊断进化。

AI Master 建议

医疗AI应用者可关注Baichuan-M4的API接入,特别适合预问诊、辅助诊断和患者教育场景。

Baichuan-M4要点

项目 详情
开发方 百川智能 + 清华大学
HealthBench综合分 68.6(领先GPT-5.5超10分)
事实性幻觉率 3.3%
SCAN-bench初诊得分 接近80%
核心能力 主动问诊、临床思维、极低幻觉