Shapley Values（Shapley 值）

就是算出每个特征对这次预测到底贡献了多少分，像分蛋糕一样公平地分锅或分功

亦作、亦称：Shapley 值 · SHAP · SHapley Additive exPlanations · Shapley 加性解释

Shapley 值将合作博弈论的公平分配原则引入机器学习，让每个特征对预测结果的贡献可以被精确量化和解释。基于此的 SHAP 框架已成为工业界模型可解释性的事实标准，广泛应用于金融、医疗、自动驾驶等高风险决策场景。

概述

概述：什么是 Shapley 值

Shapley 值是合作博弈论中的经典概念，如今成为机器学习可解释性的核心工具。

合作博弈论起源：1953 年 Lloyd Shapley 证明，满足效率性、对称性、虚拟性和可加性四条公理的收益分配方案唯一存在，即 Shapley 值
迁移到 ML：2017 年 SHAP 框架将「玩家」替换为「特征」，将「收益」替换为「预测值与基线之差」，为任意机器学习模型提供理论严格的特征归因
双重解释能力：既能给出单条样本的局部解释（为何这笔贷款被拒），也能聚合为全局特征重要性（哪些特征对模型整体影响最大）
Lloyd Shapley 因合作博弈论贡献于 2012 年获得诺贝尔经济学奖

工作原理：如何计算 Shapley 值

Shapley 值通过枚举所有特征排列组合，计算每个特征的平均边际贡献。

边际贡献：将特征 i 加入某个特征子集（联盟）前后，模型预测值的变化量即为该排列下特征 i 的边际贡献
平均化：对所有可能的特征排列取平均，消除加入顺序的影响，得到公平的贡献估计
基线（Baseline）：通常取训练集的平均预测值，所有特征的 SHAP 值之和等于当前预测值与基线之差
精确计算复杂度：特征数为 n 时需遍历 2ⁿ 个子集，计算量指数增长，实践中通常使用采样近似（KernelSHAP）或针对特定模型结构的高效算法（TreeSHAP）
SHAP 值可正可负：正值表示该特征将预测值推高，负值表示将预测值拉低，绝对值大小反映影响力

主要变体与实现

SHAP 生态针对不同模型类型提供了多种高效实现。

KernelSHAP：模型无关的近似方法，通过带权回归估计 Shapley 值，适用于任意黑盒模型，但速度较慢
TreeSHAP：专为树模型（XGBoost、LightGBM、随机森林等）设计，时间复杂度从指数降至多项式，支持精确计算
DeepSHAP：基于 DeepLIFT 思想，针对深度神经网络近似 Shapley 值，利用反向传播加速
LinearSHAP：针对线性模型的精确快速实现，可处理特征相关性
SHAP 可视化工具：蜂群图（Beeswarm）、瀑布图（Waterfall）、依赖图（Dependence Plot）等，直观呈现特征贡献分布

应用场景

Shapley 值/SHAP 在高风险决策和模型调试中均有广泛应用。

金融风控：解释信贷拒绝原因，满足 GDPR「自动化决策解释权」及中国相关合规要求；识别模型中潜在的歧视性特征
医疗诊断辅助：量化各临床指标对疾病风险预测的贡献，帮助医生理解和审查 AI 建议
模型调试与特征选择：通过全局 SHAP 重要性发现冗余特征、数据泄露或意外的强相关特征
自然语言处理：Token 级别 SHAP 分析哪些词汇驱动了情感分类、毒性检测等文本任务的决策
科学研究：在基因组学、材料科学等领域用于识别对预测目标贡献最大的变量，辅助机理发现

与其他可解释性方法的区别

SHAP 与 LIME、梯度方法等主流解释技术各有侧重，选择时需权衡。

SHAP vs LIME：LIME 拟合局部线性代理模型，速度更快但一致性较差；SHAP 有公理保证，局部+全局均适用，但计算成本更高
SHAP vs 梯度方法（Grad-CAM、Integrated Gradients）：梯度方法针对神经网络，计算高效；SHAP 模型无关，满足更严格的公理，但对大模型近似误差更大
SHAP vs 置换重要性（Permutation Importance）：置换重要性是全局方法，无法解释单条样本；SHAP 兼具局部与全局解释能力
核心优势：SHAP 满足的四条公理（效率性、对称性、虚拟性、可加性）在理论上保证了解释的唯一性和公平性，是目前理论基础最严格的特征归因方法

局限与误区

Shapley 值并非万能，实践中需注意以下陷阱。

计算复杂度指数增长：精确 Shapley 值需枚举 2ⁿ 个特征子集，特征超过约 20 个时精确计算通常不可行，必须使用近似
特征相关性问题：当特征高度相关时，SHAP 的边际贡献分配可能将贡献分散到相关特征间，产生反直觉结果；部分实现（如 KernelSHAP）假设特征独立，在相关特征上会引入偏差
解释不等于因果：SHAP 值反映特征与预测的相关性贡献，不代表因果关系；高 SHAP 值的特征不一定是干预目标
基线选择影响结果：不同基线（均值、零向量、特定参考点）会导致 SHAP 值分布不同，需根据业务语义谨慎选择
对抗性解释风险：研究表明可以构造模型，使其对某类群体做出歧视性预测，同时输出「公平」的 SHAP 解释，解释本身可能被操控

发展脉络

从博弈论到机器学习标准工具，Shapley 值经历了七十年的演进。

1953 年：Lloyd Shapley 在论文「A Value for n-Person Games」中提出 Shapley 值，证明其在合作博弈公平分配中的唯一性
2012 年：Lloyd Shapley 与 Alvin Roth 共同获得诺贝尔经济学奖，Shapley 值在经济学领域的价值得到最高认可
2016 年：Ribeiro 等提出 LIME（KDD 2016），掀起事后可解释性研究热潮，为 SHAP 的出现奠定背景
2017 年：Lundberg & Lee 在 NeurIPS 发表「A Unified Approach to Interpreting Model Predictions」，提出 SHAP 框架，将 Shapley 值系统引入 ML
2018 年：Lundberg 等提出 TreeSHAP，将树模型的 SHAP 计算从指数降至多项式复杂度，使 SHAP 在工业界大规模落地
2020 年：TreeExplainer 扩展发表于 Nature Machine Intelligence，SHAP 成为 Kaggle 竞赛和工业界模型解释的事实标准
2023 年至今：SHAP 扩展至大语言模型（LLM）归因分析，与机械可解释性（Mechanistic Interpretability）研究方向相互补充

常见误解

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

「就是算出每个特征对这次预测到底贡献了多少分，像分蛋糕一样公平地分锅或分功」
「SHAP 值正的说明这个特征让预测值升高了，负的说明它拉低了，绝对值越大影响越大」
「Shapley 值保证了不管特征顺序怎么排，最终分配的贡献加起来等于预测值与基线的差——这比单纯的特征重要性靠谱多了」

外部参考

维基百科：查看「Shapley Values」词条

本页内容为本站原创撰写；维基百科链接仅作延伸参考。

速览

一句话定义: 一种基于合作博弈论的特征归因方法，通过计算每个特征在所有可能联盟中的平均边际贡献，公平量化其对模型预测的影响。
提出: 1953 年由 Lloyd Shapley 提出（博弈论）；2017 年由 Lundberg & Lee 将其系统引入机器学习（SHAP）
关键论文 / 来源: Shapley, L.S.「A Value for n-Person Games」(1953); Lundberg & Lee「A Unified Approach to Interpreting Model Predictions」(NeurIPS 2017); Lundberg et al.「From local explanations to global understanding with explainable AI for trees」(Nature Machine Intelligence, 2020)

分类

机器学习 AI 伦理与安全数学基础