统计学术语「统计功效」指什么？

Question 1

统计学术语「统计功效」指什么？

Accepted Answer

定义：在 H₁ 为真时，检验拒绝 H₀ 的概率 = 1 − β（β 为 II 类错误 率）。 影响因素（功效↑当）： - 效应量 ↑（差异更明显） - 样本量 n ↑ - 显著性水平 α ↑（更宽松阈值） - 方差 σ² ↓（噪声更小） - 单侧检验（相对双侧，同 α 下功效更高） 功效分析用途： 1. 实验设计：A/B 测试需多少用户才能检出 δ 提升？ 2. 事后解释：阴性结果可能是功效不足而非无效应 3. 元分析：合并研究考虑各研究功效 工具：G*Power、statsmodels.stats.power、pwr（R）。 与 置信区间 宽度互补：窄 CI + 高功效才更有说服力。

Question 2

α 和 β 的权衡是什么？

Accepted Answer

固定 n 和效应，降低 α（更严）会降低功效、增大 β。Neyman-Pearson 框架在约束 α 下最大化功效。实践中常先定 α=0.05 再算所需 n。

Question 3

事后功效（post-hoc power）有什么问题？

Accepted Answer

观测到不显著后算功效常是循环论证（与 p 值信息重复）。更有用的是事前样本量计算或报告置信区间。

Question 4

ML 实验里的 power 怎么理解？

Accepted Answer

可类比：检出「模型 B 优于 A」的概率。需设定最小可接受提升 δ、重复次数、检验方法；否则容易因验证集太小而结论不稳。

统计学术语「统计功效」指什么？

核心要点

标准回答

常见误区

追问

延伸学习