精确率、召回率与 F1 分别衡量什么？如何取舍？

Question 1

Accepted Answer

三个指标的定义 精确率 Precision = TP/(TP+FP)，回答「我说是正例的，有多少真是正例」，代价是误报（FP）。召回率 Recall = TP/(TP+FN)，回答「真正的正例，我找回了多少」，代价是漏报（FN）。 为什么需要 F1 精确率和召回率通常此消彼长，单看一个会被钻空子（如全预测为正可让召回率=1）。F1 = 2·P·R/(P+R) 取两者的调和平均，只有当两者都高时 F1 才高，比算术平均更惩罚不均衡。 如何取舍 取舍由分类阈值控制：提高阈值更保守，精确率升、召回率降。选点取决于业务代价——垃圾邮件、推荐里误报代价高，偏精确率；癌症筛查、风控里漏报代价高，偏召回率。也可用 Fβ 加权或直接看 PR 曲线选工作点。

Question 2

类别极度不平衡时该看什么指标？

Accepted Answer

优先看精确率、召回率、F1 以及 PR-AUC，而非准确率。PR 曲线只关注正类，对不平衡更敏感；ROC-AUC 在极端不平衡时可能偏乐观。

Question 3

Fβ 中 β 怎么取？

Accepted Answer

Fβ = (1+β²)·P·R/(β²·P+R)。β>1（如 F2）更看重召回率，适合漏报代价高的场景；β<1（如 F0.5）更看重精确率。β=1 即标准 F1，两者等权。

精确率、召回率与 F1 分别衡量什么？如何取舍？

核心要点

标准回答

常见误区

追问

延伸学习