核心要点
相关≠因果:相关可能源于混淆变量、反向因果或选择偏差,不代表干预会改变结果。
金标准是随机对照实验(A/B 测试),随机分组消除混淆。
观测数据下用倾向得分匹配、双重差分(DiD)、工具变量(IV)等估计因果效应。
用因果图(DAG)刻画变量关系,识别需要控制/不可控制的变量。
标准回答
相关与因果的区别
相关性只描述两个变量一起变化,可能由混淆变量、反向因果或选择偏差造成;因果关系回答「干预 X 是否会改变 Y」这一反事实问题。看到相关不能推出干预有效。
金标准:随机实验
随机对照实验(线上即 A/B 测试)把个体随机分到处理组与对照组,使两组在其他因素上同分布,从而把组间差异归因于干预,是估计因果效应最可靠的方式。
观测数据下的常用方法
- 倾向得分匹配:用协变量估计接受处理的倾向,匹配相似个体以平衡混淆。
- 双重差分(DiD):比较处理组与对照组在干预前后的变化之差,抵消固定差异。
- 工具变量(IV):借助只通过处理影响结果的外生变量,剥离混淆。
- 因果图(DAG):明确变量因果结构,识别该控制哪些变量、避免控制中介或对撞变量。
这些方法都需要可识别性假设(如无未观测混淆)才能成立。
常见误区
⚠️ 常见踩坑
不要「控制越多变量越好」:控制中介变量会吸收掉部分因果效应,控制对撞变量(collider)反而会引入虚假关联,需要先用因果图判断该调整哪些变量。
追问
追问 1:双重差分(DiD)成立的关键假设是什么?
平行趋势假设:在没有干预的反事实世界里,处理组与对照组的结果会沿相同趋势变化。只有该假设成立,干预后两组变化之差才能归因于干预。常通过观察干预前多期趋势是否平行来做佐证。
追问 2:什么时候用工具变量而不是倾向得分匹配?
当存在无法观测的混淆变量时,倾向得分匹配只能平衡可观测协变量,依然有偏。此时若能找到一个只通过处理影响结果、且与未观测混淆无关的工具变量,就能用 IV 剥离混淆、估计因果效应;代价是合格的工具变量很难找。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。