Stable Baselines3
稳定基线 RL 算法库,13K+ stars。PyTorch 版本的 Stable Baselines,可靠的强化学习算法实现,包含 PPO、A2C、DQN 等主流算法
🎯适用场景:强化学习算法实验、机器人/游戏 AI 策略训练
📥 收录于 2026/5/7
📊 仓库数据
✅ 优点
- •PyTorch 版 Stable Baselines 官方实现
- •内置 PPO/SAC/DQN 等主流算法
- •文档与示例完善
- •Python 生态友好
⚠️ 限制
- •需理解 RL 理论基础
- •复杂环境调参耗时
- •训练消耗 GPU 资源
🔗 相关工具
Pytorch
github.com/pytorch/pytorch
Meta 开源的深度学习框架,100K+ stars。以动态计算图和 Pythonic 风格著称,在学术界和工业界都有广泛应用,支持分布式训练、移动端部署和 ONNX 导出
🎯深度学习模型研发、学术论文实验、大模型微调训练
onnxruntime
github.com/microsoft/onnxruntime
ONNX 推理加速引擎,4.4K+ stars。ONNX Runtime 跨平台高性能 ML 推理和训练加速器,支持多种硬件后端
🎯跨平台 ONNX 模型推理加速、边缘与云端部署
Transformers
github.com/huggingface/transformers
Hugging Face 核心模型库,159,648+ stars。支持 200K+ 预训练模型,覆盖 NLP、计算机视觉、音频、多模态等全领域,提供统一 API 接口,是 AI 开发者的必备基础设施
🎯多模型 API 统一接入与路由
LLM Course
github.com/mlabonne/llm-course
LLM 学习路线图,78,479+ stars。从入门到精通的系统学习资源,涵盖 Transformers 原理、微调、RLHF、量化部署等关键技术方向,是 AI 开发者的成长指南
🎯AI 技术学习与实践教程、大模型微调与训练
Keras
github.com/keras-team/keras
深度学习框架,64,020+ stars。高级神经网络 API,支持 TensorFlow、JAX、PyTorch 多后端。以用户友好著称,让深度学习从实验到生产的转化变得简单高效
🎯大模型微调与训练
PyTorch Image Models
github.com/huggingface/pytorch-image-models
Hugging Face 维护的最大 PyTorch 图像模型集合,36K+ stars。涵盖 Vision Transformer、ConvNeXt、EfficientNet、MobileNet 等数百种预训练图像编码器,提供训练、评估、推理完整工具链,是计算机视觉领域的标准基础设施
🎯多模态内容理解与生成