二项分布在统计学中的作用是什么？

Question 1

二项分布在统计学中的作用是什么？

Accepted Answer

设定：进行 n 次独立试验，每次成功概率 p，成功次数 X ~ Binomial(n, p)。 PMF：P(X=k) = C(n,k) p^k (1−p)^{n−k}，k = 0,1,...,n 数字特征：E[X] = np，Var(X) = np(1−p) 作用： 1. 比例建模：转化率、点击率、缺陷率 2. 假设检验：二项精确检验、比例 z 检验（大 n 近似正态） 3. 置信区间：Wilson score interval 比 Wald 更稳 4. ML：逻辑回归输出可视为 p，多个 Bernoulli 组成似然 近似：n 大时 Binomial(n,p) ≈ Normal(np, np(1−p))；p 小、n 大时 ≈ Poisson(np)。见 概率论基础。

Question 2

Binomial 和 Bernoulli 有什么关系？

Accepted Answer

Bernoulli(p) 是单次试验（取 0/1），是 n=1 的特例；Binomial(n,p) 是 n 次独立同参数 Bernoulli 之和。即 X=ΣXᵢ，Xᵢ~Bernoulli(p)。因此 E[X]=np、Var(X)=np(1−p) 都由可加性直接得到。

Question 3

何时用二项检验而非卡方检验？

Accepted Answer

单比例 vs 理论值、两比例比较（小样本）用二项/精确 Fisher。多类别拟合优度用卡方。样本量小勿盲目用正态近似。

Question 4

负二项分布与二项有何不同？

Accepted Answer

二项：固定 n 次试验看成功数；负二项：固定成功次数 r，看所需试验次数。过离散计数数据（方差>均值）常用负二项而非二项/Poisson。

二项分布在统计学中的作用是什么？

核心要点

标准回答

常见误区

追问

延伸学习