核心要点
离散用 PMF P(X=x)(单点概率可>0),连续用 PDF f(x)(单点概率=0,概率靠区间积分 ∫f)
能各举典型分布:离散 Bernoulli/Binomial/Poisson,连续 Normal/Uniform/Exponential
两者都可用 CDF F(x)=P(X≤x) 统一描述:离散是阶梯函数,连续是连续曲线
期望计算:离散 Σx·P(X=x),连续 ∫x·f(x)dx
标准回答
| 离散 | 连续 | |
|---|---|---|
| 取值 | 可数点(0,1,2…) | 区间实数 |
| 概率描述 | PMF P(X=x) |
PDF f(x),P(a<X<b)=∫_a^b f |
| 单点概率 | 可 > 0 | 单点概率 = 0 |
| 例子 | Bernoulli, Binomial, Poisson, Geometric | Normal, Uniform, Exponential, Beta |
CDF:F(x) = P(X ≤ x),离散为阶梯函数,连续为光滑曲线。
期望:离散 Σ x·P(X=x);连续 ∫ x·f(x)dx。
ML 联系:
- 分类标签 → 离散(Categorical)
- 回归目标 → 常建模为连续(高斯似然)
- 计数数据 → Poisson/负二项
详见 概率论基础。
常见误区
⚠️ 常见踩坑
把连续分布的密度 f(x) 当成概率,进而认为连续随机变量在某一点 x 有正概率——连续情形 P(X=x)=0,概率只对区间有意义。另一误区:误以为 PDF 值必须 ≤1;密度可以大于 1(如窄区间上的均匀分布),只要积分为 1 即可,真正受限于 [0,1] 的是概率本身。
追问
追问 1:PDF 值可以大于 1 吗?
可以。PDF 是密度而非概率,约束是 ∫f(x)dx=1 而非 f(x)≤1。例如 Uniform(0, 0.5) 在区间内 f(x)=2;只要总积分为 1 即合法。受 [0,1] 限制的是概率,不是密度。
追问 2:混合分布是什么?
由若干分布按权重加权组合:f(x)=Σ wₖ fₖ(x),权重 wₖ≥0 且和为 1。可同时含离散与连续成分(如零膨胀模型)。高斯混合模型 GMM 是经典例子,用于聚类与密度估计。
追问 3:Poisson 是离散还是连续?
离散。取值为非负整数 0,1,2,…,用 PMF P(X=k)=λᵏe^{−λ}/k! 描述,建模单位时间/空间内事件计数。注意它与连续的 Exponential(事件间隔时间)配对出现在泊松过程中。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。