DeepSpeed

开源训练 & 微调42k

DeepSpeed 是微软开发的深度学习优化库,使分布式训练和推理变得简单高效。支持 ZeRO 优化、模型并行、流水线并行、混合精度训练、推理加速等功能,可在消费级 GPU 上训练万亿参数模型。42K+ stars。

🎯适用场景:大规模深度学习模型分布式训练与推理加速

#Billion-parameters#Compression#Data-parallelism#Deep-learning

📥 收录于 2026/6/3

📊 仓库数据

Stars42,442
Forks4,849
语言Python
更新2026/6/2

优点

  • 微软官方维护技术实力强
  • 支持 ZeRO 等前沿优化技术
  • 可在消费级 GPU 上训练大模型
  • 与 PyTorch 无缝集成

⚠️ 限制

  • 配置和使用有一定学习成本
  • 分布式环境部署需要运维经验
  • 主要针对大规模场景小模型收益有限

🔗 相关工具

LLaMA Factory

开源72k↑+2

github.com/hiyouga/LLaMA-Factory

100+ 大模型高效微调工具,71K+ stars。支持 LoRA、QLoRA、DPO、PPO 等 10+ 种微调方法,提供 WebUI 一键式微调界面,兼容 LLaMA、Mistral、Qwen、Baichuan 等主流模型。ACL 2024 论文收录

🎯大模型微调与训练

#LLM#微调#LoRA#WebUI
语言Python
🍴 Forks8,777
📅 上线2023/4/1
🔄 更新2026/6/2
📥 收录2026/4/21

Unsloth

开源66k↑+2

github.com/unslothai/unsloth

LLM 微调 Web UI 和优化工具,62,269+ stars。提供 2 倍训练速度、70% 显存占用的 LLM 微调方案,支持 Llama、Mistral、Qwen 等主流模型的 LoRA/QLoRA 微调

🎯大模型微调与训练

#LLM微调#LoRA#显存优化#Web UI
语言Python
🍴 Forks5,865
📅 上线2023/11/29
🔄 更新2026/6/2
📥 收录2026/4/20

Keras

开源64k↑+1

github.com/keras-team/keras

深度学习框架,64,020+ stars。高级神经网络 API,支持 TensorFlow、JAX、PyTorch 多后端。以用户友好著称,让深度学习从实验到生产的转化变得简单高效

🎯大模型微调与训练

#深度学习#神经网络#多后端#TensorFlow
语言Python
🍴 Forks19,750
📅 上线2015/3/28
🔄 更新2026/6/2
📥 收录2026/4/20

nanoChat

开源55k

github.com/karpathy/nanochat

Karpathy 用 100 美元能买到的最佳 ChatGPT 体验,从数据到训练到推理的完整实现

🎯大模型微调与训练

#llm#chat#training#karpathy
语言Python
🍴 Forks7,398
🔄 更新2026/6/2
📥 收录2026/5/18

DeepSpeed

开源42k

github.com/microsoft/DeepSpeed

深度学习训练优化库,42,156+ stars。微软开发的开源深度学习优化库,提供 ZeRO 内存优化、3D 并行等核心技术,大幅降低大模型训练成本

🎯大模型微调与训练

#深度学习#训练优化#ZeRO#分布式训练
语言Python
🍴 Forks4,849
🔄 更新2026/6/2
📥 收录2026/4/20

ColossalAI

开源41k

github.com/hpcaitech/ColossalAI

大模型训练加速框架,41,373+ stars。统一的大模型训练框架,提供高效的并行策略和内存优化,支持从预训练到微调的全流程

🎯大模型微调与训练

#大模型#训练加速#并行策略#内存优化
语言Python
🍴 Forks4,506
📅 上线2021/10/28
🔄 更新2026/6/2
📥 收录2026/4/20