因果推断与相关性有什么区别？常用方法有哪些？

Question 1

Accepted Answer

相关与因果的区别 相关性只描述两个变量一起变化，可能由混淆变量、反向因果或选择偏差造成；因果关系回答「干预 X 是否会改变 Y」这一反事实问题。看到相关不能推出干预有效。 金标准：随机实验 随机对照实验（线上即 A/B 测试）把个体随机分到处理组与对照组，使两组在其他因素上同分布，从而把组间差异归因于干预，是估计因果效应最可靠的方式。 观测数据下的常用方法 - 倾向得分匹配：用协变量估计接受处理的倾向，匹配相似个体以平衡混淆。 - 双重差分（DiD）：比较处理组与对照组在干预前后的变化之差，抵消固定差异。 - 工具变量（IV）：借助只通过处理影响结果的外生变量，剥离混淆。 - 因果图（DAG）：明确变量因果结构，识别该控制哪些变量、避免控制中介或对撞变量。 这些方法都需要可识别性假设（如无未观测混淆）才能成立。

Question 2

双重差分（DiD）成立的关键假设是什么？

Accepted Answer

平行趋势假设：在没有干预的反事实世界里，处理组与对照组的结果会沿相同趋势变化。只有该假设成立，干预后两组变化之差才能归因于干预。常通过观察干预前多期趋势是否平行来做佐证。

Question 3

什么时候用工具变量而不是倾向得分匹配？

Accepted Answer

当存在无法观测的混淆变量时，倾向得分匹配只能平衡可观测协变量，依然有偏。此时若能找到一个只通过处理影响结果、且与未观测混淆无关的工具变量，就能用 IV 剥离混淆、估计因果效应；代价是合格的工具变量很难找。

因果推断与相关性有什么区别？常用方法有哪些？

核心要点

标准回答

常见误区

追问

延伸学习