Axolotl

LLM 微调训练工具，12K+ stars。支持 LoRA/QLoRA/全参数微调、DPO/ORPO 等对齐方法，兼容 Llama、Mistral、Qwen 等主流模型。提供 YAML 配置驱动的训练流程，是 LLM 微调的事实标准工具之一

🎯适用场景：大模型微调与训练

#LLM 微调#LoRA#DPO#训练工具

📥 收录于 2026/5/21

访问工具 📖 官方文档

📊 仓库数据

Stars12,180

Forks1,389

语言Python

上线2023/4/14

更新2026/7/10

📈 Stars 变化 ↑12 小时 +4· 统计区间 7/10 12:08 → 7/11 00:11（12 小时）

✅ 优点

•YAML 配置驱动训练
•支持多种对齐方法
•主流模型全覆盖
•社区活跃教程丰富

⚠️ 限制

•多 GPU 训练配置复杂
•大模型微调需要大量显存
•训练时间长

🔗 相关工具

LLaMA Factory

开源⭐ 73k↑+19

github.com/hiyouga/LLaMA-Factory

100+ 大模型高效微调工具，71K+ stars。支持 LoRA、QLoRA、DPO、PPO 等 10+ 种微调方法，提供 WebUI 一键式微调界面，兼容 LLaMA、Mistral、Qwen、Baichuan 等主流模型。ACL 2024 论文收录

🎯大模型微调与训练

#大语言模型#微调#LoRA#WebUI

语言Python

🍴 Forks8,936

📅 上线2023/4/1

🔄 更新2026/7/10

📥 收录2026/4/21

Unsloth

开源⭐ 68k↑+19

github.com/unslothai/unsloth

LLM 微调 Web UI 和优化工具，62,269+ stars。提供 2 倍训练速度、70% 显存占用的 LLM 微调方案，支持 Llama、Mistral、Qwen 等主流模型的 LoRA/QLoRA 微调

🎯大模型微调与训练

#LLM微调#LoRA#显存优化#Web UI

语言Python

🍴 Forks6,121

📅 上线2023/11/30

🔄 更新2026/7/11

📥 收录2026/4/20

ART

开源⭐ 10k↑+8

github.com/OpenPipe/ART

OpenPipe 开源的 Agent 强化学习训练框架，基于 GRPO 算法对多步 Agent 进行实战训练，支持 Qwen3.6、GPT-OSS、Llama 等主流模型

🎯对 AI Agent 进行强化学习微调，提升复杂任务的执行成功率

#强化学习#GRPO#Agent 训练#Qwen+1

语言Python

🍴 Forks940

🔄 更新2026/7/10

📥 收录2026/6/6

LlamaFactory

开源⭐ 73k↑+19

github.com/hiyouga/LlamaFactory

统一高效微调 100+ 大模型，71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架（ACL 2024 论文收录）

🎯大模型微调与训练

#智能体#ai#deepseek#微调+1

语言Python

🍴 Forks8,936

📅 上线2023/5/28

🔄 更新2026/7/10

📥 收录2026/5/20

nanoChat

开源⭐ 56k↑+10

github.com/karpathy/nanochat

Karpathy 用 100 美元能买到的最佳 ChatGPT 体验，从数据到训练到推理的完整实现

🎯大模型微调与训练

#大语言模型#chat#训练#karpathy

语言Python

🍴 Forks7,740

🔄 更新2026/7/10

📥 收录2026/5/18

llm.c

开源⭐ 31k↑+6

github.com/karpathy/llm.c

Karpathy 用纯 C 和 CUDA 实现的 LLM 训练项目，摆脱 Python 依赖，追求极致性能

🎯大模型微调与训练

#大语言模型#cuda#c#performance

语言Cuda

🍴 Forks3,692

🔄 更新2026/7/10

📥 收录2026/5/18

← 浏览全部 1267 个工具