DeepSpeed

深度学习训练优化库,42,156+ stars。微软开发的开源深度学习优化库,提供 ZeRO 内存优化、3D 并行等核心技术,大幅降低大模型训练成本

🎯适用场景:大模型微调与训练

#深度学习#训练优化#ZeRO#分布式训练

📥 收录于 2026/4/20

📊 仓库数据

Stars42,593
Forks4,868
语言Python
更新2026/6/28

📈 Stars 变化 6 小时 +1· 统计区间 6/28 18:12 → 6/29 00:15(6 小时)

优点

  • 显著降低显存占用
  • 训练速度提升明显
  • 微软官方持续维护
  • 与 PyTorch 无缝集成

⚠️ 限制

  • 配置参数复杂
  • 调试困难
  • 对硬件环境有特定要求

🔗 相关工具

DeepSpeed

开源43k+1

github.com/deepspeedai/DeepSpeed

DeepSpeed 是微软开发的深度学习优化库,使分布式训练和推理变得简单高效。支持 ZeRO 优化、模型并行、流水线并行、混合精度训练、推理加速等功能,可在消费级 GPU 上训练万亿参数模型。42K+ stars。

🎯大规模深度学习模型分布式训练与推理加速

#Billion-parameters#压缩#Data-parallelism#深度学习
语言Python
🍴 Forks4,868
🔄 更新2026/6/28
📥 收录2026/6/3

ColossalAI

开源41k-1

github.com/hpcaitech/ColossalAI

大模型训练加速框架,41,373+ stars。统一的大模型训练框架,提供高效的并行策略和内存优化,支持从预训练到微调的全流程

🎯大模型微调与训练

#大模型#训练加速#并行策略#内存优化
语言Python
🍴 Forks4,505
📅 上线2021/10/29
🔄 更新2026/6/28
📥 收录2026/4/20

RLLM

开源5.7k+2

github.com/rllm-org/rllm

LLM 强化学习开源框架,致力于降低强化学习应用于大语言模型的门槛,支持分布式训练、编码 Agent、搜索 Agent 等多种场景,是 verl 生态的重要组成部分。

🎯LLM强化学习与奖励模型训练,适合研究型团队探索Agent自主学习能力

#强化学习#LLM训练#RL#分布式训练+1
语言Python
🍴 Forks580
🔄 更新2026/6/28
📥 收录2026/6/9

Tensorflow

开源196k+5

github.com/tensorflow/tensorflow

全球最流行的机器学习框架之一,195K+ stars。Google 开源的端到端 ML 平台,支持 TensorFlow、Keras 等多种 API,覆盖深度学习、强化学习、移动端部署等全场景,是 AI 工程师的必备工具

🎯深度学习模型训练、移动端 AI 部署、生产环境 ML 推理服务

#深度学习#deep-neural-networks#分布式#机器学习+1
语言C++
🍴 Forks75,189
🔄 更新2026/6/28
📥 收录2026/4/11

Pytorch

开源101k+6

github.com/pytorch/pytorch

Meta 开源的深度学习框架,100K+ stars。以动态计算图和 Pythonic 风格著称,在学术界和工业界都有广泛应用,支持分布式训练、移动端部署和 ONNX 导出

🎯深度学习模型研发、学术论文实验、大模型微调训练

#autograd#深度学习#gpu#机器学习+1
语言Python
🍴 Forks28,148
🔄 更新2026/6/28
📥 收录2026/4/11

动手学深度学习

开源79k-1

github.com/d2l-ai/d2l-zh

李沐等翻译的《动手学深度学习》中文版,77,310+ stars。基于 MXNet/PyTorch 的深度学习教材,从线性回归到 Transformer,每章含可运行代码和习题。是中国最受欢迎的深度学习入门教材,被多所高校选为课程教材。

🎯AI 技术学习与实践教程

#深度学习#教程#中文#教材
语言Python
🍴 Forks12,282
📅 上线2018/5/1
🔄 更新2026/6/28
📥 收录2026/4/21