Federated Learning（联邦学习）

就是各家把自己的数据锁在本地，只把学到的『经验』传给中央服务器，拼出一个更聪明的模型，数据自己不外流。

亦作、亦称：联邦学习 · FL · federated ML · 联邦机器学习

联邦学习让数据「留在原地」，让模型「走遍天下」——各参与方只交换参数更新，而非原始样本。这一范式在保护用户隐私的同时，突破了数据孤岛限制，是隐私计算的核心技术之一。

概述

联邦学习是应对数据隐私与数据孤岛的核心解法，核心思路是「模型旅行，数据静止」。

提出背景：传统集中式训练需要将数据汇总到云端，在 GDPR、HIPAA 等法规收紧的背景下面临合规障碍
核心目标：在不共享原始数据的条件下，联合多个数据孤岛共同训练高质量模型
主要角色：中央服务器（协调者）+ 多个客户端（数据持有方）
代表算法：FedAvg（联邦平均），以各客户端本地数据量加权平均梯度/权重
首次落地：Google Gboard（Android 键盘下一词预测），2017 年上线

工作原理

联邦学习的训练流程在「全局轮次」中循环执行。

第一步分发：服务器将当前全局模型参数广播给选定的客户端子集
第二步本地训练：每个客户端用本地私有数据对模型进行若干轮 SGD，得到本地更新（梯度或权重差）
第三步上传：客户端仅将模型更新（非原始数据）发送至服务器
第四步聚合：服务器执行 FedAvg 等聚合算法，合并各客户端更新，生成新的全局模型
第五步迭代：重复上述流程直至模型收敛或达到预设轮次

主要类型

按数据划分方式，联邦学习分为三种主流形态。

水平联邦学习（Horizontal FL）：各方特征空间相同、样本不同（如不同地区的医院，特征字段一致但患者不同）
垂直联邦学习（Vertical FL）：各方样本重叠、特征维度不同（如银行有金融数据、电商有消费数据，用户群体重合）
联邦迁移学习（Federated Transfer Learning）：样本与特征均不同，借助迁移学习在小交集数据上完成建模
跨设备 vs 跨机构：跨设备（如手机）客户端数量可达百万级、通信不稳定；跨机构客户端数量少但计算能力强

应用场景

联邦学习在数据敏感、合规要求高的行业已有广泛落地。

智能手机：输入法下一词预测、语音唤醒词识别，Google/Apple 均有部署
医疗健康：多家医院联合训练肿瘤检测模型，患者病历不出院
金融风控：银行间联合反欺诈、反洗钱模型，交易数据各自保密
工业 IoT：工厂设备预测性维护，传感器数据留在边缘节点
自动驾驶：多车企共享驾驶场景模型，避免商业数据外泄

与分布式训练的区别

联邦学习与传统分布式训练共用「多节点」架构，但目标与约束截然不同。

数据归属：分布式训练中数据由同一实体掌控，联邦学习中数据属于各自独立的参与方
隐私约束：分布式训练可以自由共享中间数据，联邦学习严格禁止原始数据离开本地
节点规模：分布式训练节点数通常较少且稳定，联邦学习客户端可达数百万且随时掉线
数据分布：分布式训练通常假设 IID，联邦学习天然面对 Non-IID 挑战
通信效率：联邦学习对带宽极为敏感，压缩梯度、减少通信轮次是核心优化方向

局限与误区

联邦学习并非「绝对隐私」，在实际应用中存在多项挑战。

梯度泄露：通过梯度反推（Gradient Inversion 攻击）可部分还原训练数据，需配合差分隐私（DP）
模型投毒：恶意客户端可上传伪造梯度影响全局模型，需要鲁棒聚合（如 Krum、Median）
Non-IID 性能下降：数据分布异质性导致 FedAvg 收敛慢、精度低，FedProx、SCAFFOLD 等方法缓解此问题
通信瓶颈：大模型参数量大，上传成本高，需梯度压缩、稀疏化或异步更新
合规误解：「联邦学习 = 合规」是误区，各国法规对模型更新是否属于数据传输仍有争议

发展脉络

联邦学习从学术概念快速演进为产业级隐私计算基础设施。

2016：Google 内部提出联邦学习概念，用于 Gboard 个性化
2017：McMahan 等发表 FedAvg 论文（AISTATS），确立基础算法框架
2018：Google AI Blog 正式对外介绍联邦学习，引发学术界广泛关注
2019：微众银行开源 FATE 框架，推动企业级联邦学习落地；杨强团队系统化「横向/纵向/联邦迁移」分类
2020–2021：FedProx、SCAFFOLD、差分隐私集成方案相继提出，鲁棒性与收敛性大幅改善
2022–至今：大模型时代下，联邦学习与 LoRA 微调、LLM 结合（Federated LLM Fine-tuning）成为新热点

常见误解

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

「就是各家把自己的数据锁在本地，只把学到的『经验』传给中央服务器，拼出一个更聪明的模型，数据自己不外流。」
「联邦学习不等于完全隐私安全——梯度本身也可能泄露原始数据，还需要配合差分隐私或安全聚合。」
「水平联邦是大家特征一样但用户不同；垂直联邦是用户一样但各家掌握不同维度的数据。」

相关术语

和本术语关联紧密的其他词条，便于串联理解。

延伸阅读

从知识库精选 1 篇文章，帮助深入理解该术语。

1
MLOps 实战：模型版本管理与实验追踪
从 MLflow 到 WandB，掌握机器学习实验追踪与模型版本管理的最佳实践

外部参考

维基百科：查看「Federated Learning」词条

本页内容为本站原创撰写；维基百科链接仅作延伸参考。