Flower

开源训练 & 微调6.9k↑+1

友好的联邦学习框架,6.9K+ stars。支持多设备、多机构的分布式 AI 训练,数据不出本地即可协作训练模型。兼容 PyTorch/TensorFlow/JAX 等主流框架,是联邦学习的事实标准基础设施

🎯适用场景:多机构联合训练——医院、银行等需要数据隐私的机构可在不共享原始数据的情况下协作训练 AI 模型。

#联邦学习#分布式训练#隐私保护#多框架

📥 收录于 2026/5/30

📊 仓库数据

Stars6,922
Forks1,197
语言Python
更新2026/5/30

📈 上次抓取以来 ↑+1

优点

  • 数据不出本地,天然满足隐私合规要求
  • 兼容 PyTorch/TensorFlow/JAX 等主流框架
  • 支持跨平台部署(云端、边缘设备、移动端)
  • 活跃的学术社区,论文引用量高

⚠️ 限制

  • 联邦学习通信开销大,训练速度慢于集中式
  • 需要额外处理异构数据和非独立同分布问题

🔗 相关工具

DeepSpeed

开源42k↑+1

github.com/microsoft/DeepSpeed

深度学习训练优化库,42,156+ stars。微软开发的开源深度学习优化库,提供 ZeRO 内存优化、3D 并行等核心技术,大幅降低大模型训练成本

🎯大模型微调与训练

#深度学习#训练优化#ZeRO#分布式训练
语言Python
🍴 Forks4,841
🔄 更新2026/5/30
📥 收录2026/4/20

LLaMA Factory

开源72k↑+6

github.com/hiyouga/LLaMA-Factory

100+ 大模型高效微调工具,71K+ stars。支持 LoRA、QLoRA、DPO、PPO 等 10+ 种微调方法,提供 WebUI 一键式微调界面,兼容 LLaMA、Mistral、Qwen、Baichuan 等主流模型。ACL 2024 论文收录

🎯大模型微调与训练

#LLM#微调#LoRA#WebUI
语言Python
🍴 Forks8,760
📅 上线2023/4/1
🔄 更新2026/5/30
📥 收录2026/4/21

Unsloth

开源65k↑+20

github.com/unslothai/unsloth

LLM 微调 Web UI 和优化工具,62,269+ stars。提供 2 倍训练速度、70% 显存占用的 LLM 微调方案,支持 Llama、Mistral、Qwen 等主流模型的 LoRA/QLoRA 微调

🎯大模型微调与训练

#LLM微调#LoRA#显存优化#Web UI
语言Python
🍴 Forks5,828
📅 上线2023/11/29
🔄 更新2026/5/30
📥 收录2026/4/20

Keras

开源64k1

github.com/keras-team/keras

深度学习框架,64,020+ stars。高级神经网络 API,支持 TensorFlow、JAX、PyTorch 多后端。以用户友好著称,让深度学习从实验到生产的转化变得简单高效

🎯大模型微调与训练

#深度学习#神经网络#多后端#TensorFlow
语言Python
🍴 Forks19,751
📅 上线2015/3/28
🔄 更新2026/5/30
📥 收录2026/4/20

nanoGPT

开源59k↑+18

github.com/karpathy/nanoGPT

Karpathy 打造的训练和微调中小型 GPT 的最简最快实现,适合学习 LLM 内部原理

🎯大模型微调与训练

#llm#training#gpt#教育
语言Python
🍴 Forks10,155
🔄 更新2026/5/30
📥 收录2026/5/18

nanoChat

开源54k↑+10

github.com/karpathy/nanochat

Karpathy 用 100 美元能买到的最佳 ChatGPT 体验,从数据到训练到推理的完整实现

🎯大模型微调与训练

#llm#chat#training#karpathy
语言Python
🍴 Forks7,364
🔄 更新2026/5/30
📥 收录2026/5/18