核心要点

  • 能写出 P(A|B) = P(B|A)P(A)/P(B)

  • 理解先验、似然、后验

  • 知道朴素贝叶斯、贝叶斯推断应用

标准回答

公式
P(A|B) = P(B|A) · P(A) / P(B)

统计语境(参数 θ,数据 x):
P(θ|x) = P(x|θ) P(θ) / P(x)

  • 先验 P(θ):观测前对参数的信念
  • 似然 P(x|θ):给定参数下数据的概率
  • 后验 P(θ|x):结合数据后的更新信念
  • 证据 P(x)归一化常数,模型比较用

应用

  1. 朴素贝叶斯 分类:特征条件独立假设
  2. A/B 测试贝叶斯版:直接报告 P(变体 B 更优|数据)
  3. 医学诊断:基率 + 检验灵敏度/特异度 → 患病后验
  4. 贝叶斯神经网络、高斯过程

与频率派不同,贝叶斯把参数视为随机变量。见 概率论基础

常见误区

⚠️ 常见踩坑

混淆 P(A|B) 与 P(B|A)(检察官谬误):如把「患病时检验阳性的概率」当成「检验阳性时患病的概率」。后者还取决于患病率(基率);低患病率下即便检验很准,阳性预测值仍可能很低——忽略先验/基率是最常见的错误。

追问

追问 1先验如何选择?无信息先验是什么?

共轭先验便于计算;Jeffreys 无信息先验尽量不偏;经验贝叶斯从数据估先验。敏感分析:换先验看后验是否稳健。

追问 2贝叶斯因子 Bayes Factor 是什么?

两个模型/假设下数据边际似然之比 BF₁₀ = P(数据|H₁)/P(数据|H₀),衡量数据对 H₁ 相对 H₀ 的支持强度。与 p 值不同,它能为 H₀ 提供正面证据,但对先验设定敏感,且边际似然计算常较困难。

追问 3朴素贝叶斯「朴素」在哪?

题库专题:朴素贝叶斯分类器如何用于自然语言处理?

假设特征在给定类别下条件独立,现实中常不成立,但分类仍常有效且训练快。高维文本分类经典基线。

题库延伸:与本追问相关的专题题 → 朴素贝叶斯分类器如何用于自然语言处理?

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。