核心要点

  • 正确表述频率解释:重复抽样下约 1−α 比例的区间会覆盖真参数,而非「真参数有 95% 概率落在本区间」

  • 能写出均值 CI:x̄ ± t_{α/2,n−1}·(s/√n),并说明宽度随 √n 缩小

  • 知道 95% CI 不含某值 ⇔ 双侧 α=0.05 检验拒绝该值,CI 同时传达效应方向与精度

  • 了解 σ 未知用 t 分布、非正态可用 Bootstrap 百分位法构造

标准回答

定义置信区间(CI) 是基于样本构造的随机区间,在重复抽样中,有 1−α 比例(如 95%)的区间会包含未知总体参数(如均值 μ)。

常见形式(正态、σ 未知):
x̄ ± t_{α/2, n−1} · (s/√n)

重要性

  1. 量化不确定性:点估计 不说精度;CI 宽度反映样本量与变异
  2. 假设检验桥梁:95% CI 不含某值 ↔ 双侧检验 α=0.05 拒绝该值为参数
  3. 业务决策A/B 测试提升的 CI 是否不含 0;药物疗效 CI 是否超过非劣界

常见误区:「真实参数有 95% 概率落在本次 CI 内」——参数固定,随机的是区间。详见 概率论基础

常见误区

⚠️ 常见踩坑

把「95% CI」误读成「真参数有 95% 概率落在这一具体区间内」——真参数固定,95% 是方法在重复抽样下的长期覆盖率。另一误区:见两组 CI 有重叠就断定差异不显著;CI 重叠不等价于差值检验不显著,应直接对差值做检验或看差值的 CI。

追问

追问 1置信水平 95% 是什么意思?

若重复抽样并每次构造 95% CI,长期约 95% 的区间会盖住真值,5% 不会。说的是方法的长期覆盖率,不是单次区间的概率。

追问 2CI 越窄说明什么?

估计越精确。窄 CI 可能来自大样本、低方差或较小置信水平(如 90% vs 99%)。比较两组效应应看 CI 是否重叠。

追问 3Bootstrap 置信区间怎么用?

对样本有放回重采样 B 次,每次算统计量,取 2.5% 与 97.5% 分位数得百分位 Bootstrap CI。不依赖正态假设,适合复杂统计量。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。