什么是置信区间？在统计学中为何重要？

Question 1

什么是置信区间？在统计学中为何重要？

Accepted Answer

定义：置信区间（CI） 是基于样本构造的随机区间，在重复抽样中，有 1−α 比例（如 95%）的区间会包含未知总体参数（如均值 μ）。 常见形式（正态、σ 未知）： x̄ ± t_{α/2, n−1} · (s/√n) 重要性： 1. 量化不确定性：点估计 x̄ 不说精度；CI 宽度反映样本量与变异 2. 假设检验桥梁：95% CI 不含某值 ↔ 双侧检验 α=0.05 拒绝该值为参数 3. 业务决策：A/B 测试提升的 CI 是否不含 0；药物疗效 CI 是否超过非劣界 常见误区：「真实参数有 95% 概率落在本次 CI 内」——参数固定，随机的是区间。详见 概率论基础。

Question 2

置信水平 95% 是什么意思？

Accepted Answer

若重复抽样并每次构造 95% CI，长期约 95% 的区间会盖住真值，5% 不会。说的是方法的长期覆盖率，不是单次区间的概率。

Question 3

CI 越窄说明什么？

Accepted Answer

估计越精确。窄 CI 可能来自大样本、低方差或较小置信水平（如 90% vs 99%）。比较两组效应应看 CI 是否重叠。

Question 4

Bootstrap 置信区间怎么用？

Accepted Answer

对样本有放回重采样 B 次，每次算统计量，取 2.5% 与 97.5% 分位数得百分位 Bootstrap CI。不依赖正态假设，适合复杂统计量。

什么是置信区间？在统计学中为何重要？

核心要点

标准回答

常见误区

追问

延伸学习