LLaMA Factory
100+ 大模型高效微调工具,71K+ stars。支持 LoRA、QLoRA、DPO、PPO 等 10+ 种微调方法,提供 WebUI 一键式微调界面,兼容 LLaMA、Mistral、Qwen、Baichuan 等主流模型。ACL 2024 论文收录
🎯适用场景:大模型微调与训练
📊 仓库数据
✅ 优点
- •WebUI 一键微调
- •支持 100+ 模型
- •10+ 种微调方法
- •ACL 2024 论文收录
⚠️ 限制
- •大模型需要多 GPU
- •WebUI 功能有限
- •部分高级功能需 CLI
🔗 相关工具
ModelScope SWIFT
github.com/modelscope/ms-swift
魔搭社区出品的大模型微调框架,支持 600+ LLM 和 300+ MLLM 的全量/LoRA/DPO/GRPO 微调。覆盖 Qwen3.6、DeepSeek-R1、GLM-5.1、Llama4 等主流模型,提供 WebUI 和 CLI 双接口。14K+ stars,是中国生态最全面的微调工具
🎯大模型微调与训练
ART
github.com/OpenPipe/ART
OpenPipe 开源的 Agent 强化学习训练框架,基于 GRPO 算法对多步 Agent 进行实战训练,支持 Qwen3.6、GPT-OSS、Llama 等主流模型
🎯对 AI Agent 进行强化学习微调,提升复杂任务的执行成功率
Unsloth
github.com/unslothai/unsloth
LLM 微调 Web UI 和优化工具,62,269+ stars。提供 2 倍训练速度、70% 显存占用的 LLM 微调方案,支持 Llama、Mistral、Qwen 等主流模型的 LoRA/QLoRA 微调
🎯大模型微调与训练
Axolotl
github.com/axolotl-ai-cloud/axolotl
LLM 微调训练工具,12K+ stars。支持 LoRA/QLoRA/全参数微调、DPO/ORPO 等对齐方法,兼容 Llama、Mistral、Qwen 等主流模型。提供 YAML 配置驱动的训练流程,是 LLM 微调的事实标准工具之一
🎯大模型微调与训练
Keras
github.com/keras-team/keras
深度学习框架,64,020+ stars。高级神经网络 API,支持 TensorFlow、JAX、PyTorch 多后端。以用户友好著称,让深度学习从实验到生产的转化变得简单高效
🎯大模型微调与训练
nanoChat
github.com/karpathy/nanochat
Karpathy 用 100 美元能买到的最佳 ChatGPT 体验,从数据到训练到推理的完整实现
🎯大模型微调与训练