DeepSpeed
深度学习训练优化库,42,156+ stars。微软开发的开源深度学习优化库,提供 ZeRO 内存优化、3D 并行等核心技术,大幅降低大模型训练成本
🎯适用场景:大模型微调与训练
📊 仓库数据
📈 Stars 变化 ↑6 小时 +1· 统计区间 6/28 18:12 → 6/29 00:15(6 小时)
✅ 优点
- •显著降低显存占用
- •训练速度提升明显
- •微软官方持续维护
- •与 PyTorch 无缝集成
⚠️ 限制
- •配置参数复杂
- •调试困难
- •对硬件环境有特定要求
🔗 相关工具
DeepSpeed
github.com/deepspeedai/DeepSpeed
DeepSpeed 是微软开发的深度学习优化库,使分布式训练和推理变得简单高效。支持 ZeRO 优化、模型并行、流水线并行、混合精度训练、推理加速等功能,可在消费级 GPU 上训练万亿参数模型。42K+ stars。
🎯大规模深度学习模型分布式训练与推理加速
ColossalAI
github.com/hpcaitech/ColossalAI
大模型训练加速框架,41,373+ stars。统一的大模型训练框架,提供高效的并行策略和内存优化,支持从预训练到微调的全流程
🎯大模型微调与训练
RLLM
github.com/rllm-org/rllm
LLM 强化学习开源框架,致力于降低强化学习应用于大语言模型的门槛,支持分布式训练、编码 Agent、搜索 Agent 等多种场景,是 verl 生态的重要组成部分。
🎯LLM强化学习与奖励模型训练,适合研究型团队探索Agent自主学习能力
Tensorflow
github.com/tensorflow/tensorflow
全球最流行的机器学习框架之一,195K+ stars。Google 开源的端到端 ML 平台,支持 TensorFlow、Keras 等多种 API,覆盖深度学习、强化学习、移动端部署等全场景,是 AI 工程师的必备工具
🎯深度学习模型训练、移动端 AI 部署、生产环境 ML 推理服务
Pytorch
github.com/pytorch/pytorch
Meta 开源的深度学习框架,100K+ stars。以动态计算图和 Pythonic 风格著称,在学术界和工业界都有广泛应用,支持分布式训练、移动端部署和 ONNX 导出
🎯深度学习模型研发、学术论文实验、大模型微调训练
动手学深度学习
github.com/d2l-ai/d2l-zh
李沐等翻译的《动手学深度学习》中文版,77,310+ stars。基于 MXNet/PyTorch 的深度学习教材,从线性回归到 Transformer,每章含可运行代码和习题。是中国最受欢迎的深度学习入门教材,被多所高校选为课程教材。
🎯AI 技术学习与实践教程