核心要点

  • 离散用 PMF P(X=x)(单点概率可>0),连续用 PDF f(x)(单点概率=0,概率靠区间积分 ∫f)

  • 能各举典型分布:离散 Bernoulli/Binomial/Poisson,连续 Normal/Uniform/Exponential

  • 两者都可用 CDF F(x)=P(X≤x) 统一描述:离散是阶梯函数,连续是连续曲线

  • 期望计算:离散 Σx·P(X=x),连续 ∫x·f(x)dx

标准回答

离散 连续
取值 可数点(0,1,2…) 区间实数
概率描述 PMF P(X=x) PDF f(x)P(a<X<b)=∫_a^b f
单点概率 可 > 0 单点概率 = 0
例子 Bernoulli, Binomial, Poisson, Geometric Normal, Uniform, Exponential, Beta

CDFF(x) = P(X ≤ x),离散为阶梯函数,连续为光滑曲线。

期望:离散 Σ x·P(X=x);连续 ∫ x·f(x)dx

ML 联系

  • 分类标签 → 离散(Categorical)
  • 回归目标 → 常建模为连续(高斯似然)
  • 计数数据 → Poisson/负二项

详见 概率论基础

常见误区

⚠️ 常见踩坑

把连续分布的密度 f(x) 当成概率,进而认为连续随机变量在某一点 x 有正概率——连续情形 P(X=x)=0,概率只对区间有意义。另一误区:误以为 PDF 值必须 ≤1;密度可以大于 1(如窄区间上的均匀分布),只要积分为 1 即可,真正受限于 [0,1] 的是概率本身。

追问

追问 1PDF 值可以大于 1 吗?

可以。PDF 是密度而非概率,约束是 ∫f(x)dx=1 而非 f(x)≤1。例如 Uniform(0, 0.5) 在区间内 f(x)=2;只要总积分为 1 即合法。受 [0,1] 限制的是概率,不是密度。

追问 2混合分布是什么?

由若干分布按权重加权组合:f(x)=Σ wₖ fₖ(x),权重 wₖ≥0 且和为 1。可同时含离散与连续成分(如零膨胀模型)。高斯混合模型 GMM 是经典例子,用于聚类与密度估计。

追问 3Poisson 是离散还是连续?

离散。取值为非负整数 0,1,2,…,用 PMF P(X=k)=λᵏe^{−λ}/k! 描述,建模单位时间/空间内事件计数。注意它与连续的 Exponential(事件间隔时间)配对出现在泊松过程中。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。