核心要点
α 是 H₀ 为真时错误拒绝 H₀(I 类错误/假阳性)的概率上界,在看数据前预先设定
决策规则 p<α 拒绝 H₀;常用 0.05,高风险场景用 0.01,探索性偶用 0.10
与置信区间对偶:α=0.05 ⇔ 95% CI 覆盖率;α 越小区间越宽
理解与功效权衡:固定 n 时降低 α 会降低功效,需增大样本量补偿
简要回答
定义:显著性水平 α 是检验在 H₀ 为真时错误拒绝 H₀(I 类错误)的概率上界;
决策:p < α → 拒绝 H₀
标准回答
定义:显著性水平 α 是检验在 H₀ 为真时错误拒绝 H₀(I 类错误)的概率上界。
决策:p < α → 拒绝 H₀;结果称在 α 水平下显著。
常见取值:
- α = 0.05:社会科学、一般 A/B 测试默认
- α = 0.01 / 0.001:高风险场景(药物、安全)
- α = 0.10:探索性研究偶见
如何选择:
- 错误拒绝的成本(假阳性代价高 → 降低 α)
- 领域规范(FDA、心理学复制危机后的讨论)
- 与功效权衡:α↓ 则功效↓,需更大 n
- 多重比较:族错误率控制可能用更严有效 α
与 CI 关系:95% CI 对应双侧 α=0.05 检验(正态大样本下)。
与 p 值、统计功效、置信区间一体理解。
常见误区
⚠️ 常见踩坑
把 α 当成「H₀ 为真的概率」或「这次结论出错的概率」——α 是方法在 H₀ 为真前提下长期的假阳性率,不是单次结论的可信度。另一误区:先看了 p 值再回头调整 α 阈值以求显著,或在多重比较时仍沿用 0.05 而不做校正,都会让实际 I 类错误率远超名义值。
追问
追问 1:FDR 和 α 有什么区别?
α 通常控制单次检验 FWER。FDR(假发现率)控制被拒绝假设中假阳性比例期望,适合大量假设(基因组学),比 Bonferroni 不那么保守。
追问 2:为什么 0.05 成为惯例?
Fisher 建议的历史习惯,无绝对神圣性。近年来呼吁报告效应量、CI、预注册,并视上下文选 α 或贝叶斯方法。
追问 3:单侧检验 α 如何解释?
单侧 p 值是单尾概率,同 α 下单侧检验功效更高,但 H1 必须有方向先验。不能把双侧 p 减半偷换为单侧。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。