核心要点

  • 相关≠因果:相关可能源于混淆变量、反向因果或选择偏差,不代表干预会改变结果。

  • 金标准是随机对照实验(A/B 测试),随机分组消除混淆。

  • 观测数据下用倾向得分匹配、双重差分(DiD)、工具变量(IV)等估计因果效应。

  • 用因果图(DAG)刻画变量关系,识别需要控制/不可控制的变量。

标准回答

相关与因果的区别

相关性只描述两个变量一起变化,可能由混淆变量、反向因果或选择偏差造成;因果关系回答「干预 X 是否会改变 Y」这一反事实问题。看到相关不能推出干预有效。

金标准:随机实验

随机对照实验(线上即 A/B 测试)把个体随机分到处理组与对照组,使两组在其他因素上同分布,从而把组间差异归因于干预,是估计因果效应最可靠的方式。

观测数据下的常用方法

  • 倾向得分匹配:用协变量估计接受处理的倾向,匹配相似个体以平衡混淆。
  • 双重差分(DiD):比较处理组与对照组在干预前后的变化之差,抵消固定差异。
  • 工具变量(IV):借助只通过处理影响结果的外生变量,剥离混淆。
  • 因果图(DAG):明确变量因果结构,识别该控制哪些变量、避免控制中介或对撞变量。

这些方法都需要可识别性假设(如无未观测混淆)才能成立。

常见误区

⚠️ 常见踩坑

不要「控制越多变量越好」:控制中介变量会吸收掉部分因果效应,控制对撞变量(collider)反而会引入虚假关联,需要先用因果图判断该调整哪些变量。

追问

追问 1双重差分(DiD)成立的关键假设是什么?

平行趋势假设:在没有干预的反事实世界里,处理组与对照组的结果会沿相同趋势变化。只有该假设成立,干预后两组变化之差才能归因于干预。常通过观察干预前多期趋势是否平行来做佐证。

追问 2什么时候用工具变量而不是倾向得分匹配?

当存在无法观测的混淆变量时,倾向得分匹配只能平衡可观测协变量,依然有偏。此时若能找到一个只通过处理影响结果、且与未观测混淆无关的工具变量,就能用 IV 剥离混淆、估计因果效应;代价是合格的工具变量很难找。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。