核心要点
能写出 PDF f(x)=(1/(σ√(2π)))·exp(−(x−μ)²/(2σ²)),由均值 μ 与标准差 σ 两个参数完全决定
关于 μ 对称,均值=中位数=众数;68-95-99.7 法则:μ±1σ/±2σ/±3σ 各约含 68%/95%/99.7%
独立正态的线性组合仍是正态;标准化 Z=(X−μ)/σ 服从 N(0,1)
是 CLT 的极限分布,支撑 z/t 检验、回归残差假设等推断方法
标准回答
概率密度:f(x) = (1/(σ√(2π))) exp(−(x−μ)²/(2σ²))
关键性质:
- 参数:均值 μ,标准差 σ(方差 σ²)
- 对称于 μ,均值 = 中位数 = 众数
- 68-95-99.7 法则:μ±1σ 约 68%,±2σ 约 95%,±3σ 约 99.7%
- 线性组合:独立正态变量之和仍正态
- 尾部:轻尾(相比 t 分布);极端值概率指数下降
应用:测量误差、大样本均值近似(中心极限定理)、回归残差近似、许多检验的渐近理论。
检验:样本量小且总体方差未知时,用 t 分布 替代正态。延伸阅读:概率论基础。
常见误区
⚠️ 常见踩坑
把 CLT 误读为「数据本身会变正态」——CLT 说的是样本均值(或和)的抽样分布近似正态,原始数据可任意偏态。另一误区:默认所有数据都服从正态而盲目套用 z/t 检验;对重尾或强偏数据应先看 QQ 图/做正态性检验,必要时改用非参数方法或变换。
追问
追问 1:标准正态分布 Z 是什么?
Z ~ N(0,1),由任意正态变量标准化得到:Z = (X − μ) / σ。标准正态表给出 P(Z ≤ z),用于查临界值、构造置信区间和做 z 检验。
追问 2:数据不满足正态怎么办?
先看偏离程度:轻度偏离且 n 大时,靠 CLT 均值推断仍稳健。否则可做变换(对数、Box-Cox)使其近正态;或改用非参数方法(Wilcoxon、Bootstrap);计数/比例数据则用对应的 GLM(Poisson、Logistic)。
追问 3:多元正态分布有什么特点?
由均值向量 μ 和协方差矩阵 Σ 决定;边缘分布是正态;不相关且联合正态则独立。高斯过程、线性回归误差多元正态的基础。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。