核心要点

  • 记牢五大假设:线性、误差独立、同方差、误差正态、无多重共线性

  • 用残差图判断线性与同方差,用 VIF(>10 即严重)诊断多重共线性

  • 同方差被破坏(异方差)时改用稳健标准误或加权最小二乘 WLS

  • 多重共线性严重时用岭回归(L2)或剔除高相关特征

标准回答

五大假设

线性回归(OLS)成立依赖五个假设:1)自变量与因变量呈线性关系;2)误差项相互独立(无自相关);3)误差同方差(方差恒定);4)误差服从正态分布;5)自变量间无多重共线性

违反的后果

  • 非线性:模型欠拟合,系数无意义。
  • 误差相关(如时间序列):系数仍无偏,但标准误被低估,显著性检验失真。
  • 异方差:系数无偏但非有效,置信区间与 p 值不可靠。
  • 误差非正态:小样本下 t/F 检验失效(大样本可由中心极限定理缓解)。
  • 多重共线性:系数估计方差膨胀、符号不稳定,难以解释,但对预测影响较小。

诊断与补救

残差图查线性与同方差,QQ 图查正态,DW 检验查自相关,VIF 查共线性。补救手段包括特征变换、WLS、稳健标准误、岭回归等。

常见误区

⚠️ 常见踩坑

常误以为「自变量必须服从正态分布」——正态性是对误差项的要求,不是对自变量;且多重共线性主要损害可解释性,未必显著影响预测精度。

追问

追问 1如何检测多重共线性?阈值是多少?

计算每个自变量对其余自变量回归的方差膨胀因子 VIF = 1/(1−R²)。经验上 VIF > 10(部分严格场景 > 5)视为严重共线性。也可看相关矩阵或自变量矩阵的条件数。

追问 2异方差具体会带来什么问题?怎么处理?

异方差下 OLS 系数仍无偏,但不再是最小方差估计,标准误被错误估计导致 t 检验、置信区间失真。处理方法:使用 White 稳健标准误、加权最小二乘 WLS,或对因变量做对数等变换稳定方差。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。