Unsloth
LLM 微调 Web UI 和优化工具,62,269+ stars。提供 2 倍训练速度、70% 显存占用的 LLM 微调方案,支持 Llama、Mistral、Qwen 等主流模型的 LoRA/QLoRA 微调
🎯适用场景:大模型微调与训练
📊 仓库数据
📈 Stars 变化 ↑2 天 +100· 统计区间 6/11 00:28 → 6/12 12:34(2 天)
✅ 优点
- •训练速度翻倍
- •显存占用大幅降低
- •支持主流 LLM 模型
- •提供友好的 Web UI
⚠️ 限制
- •主要针对特定模型支持
- •大规模训练仍需较强硬件
- •部分高级功能收费
🔗 相关工具
ART
github.com/OpenPipe/ART
OpenPipe 开源的 Agent 强化学习训练框架,基于 GRPO 算法对多步 Agent 进行实战训练,支持 Qwen3.6、GPT-OSS、Llama 等主流模型
🎯对 AI Agent 进行强化学习微调,提升复杂任务的执行成功率
LLaMA Factory
github.com/hiyouga/LLaMA-Factory
100+ 大模型高效微调工具,71K+ stars。支持 LoRA、QLoRA、DPO、PPO 等 10+ 种微调方法,提供 WebUI 一键式微调界面,兼容 LLaMA、Mistral、Qwen、Baichuan 等主流模型。ACL 2024 论文收录
🎯大模型微调与训练
Axolotl
github.com/axolotl-ai-cloud/axolotl
LLM 微调训练工具,12K+ stars。支持 LoRA/QLoRA/全参数微调、DPO/ORPO 等对齐方法,兼容 Llama、Mistral、Qwen 等主流模型。提供 YAML 配置驱动的训练流程,是 LLM 微调的事实标准工具之一
🎯大模型微调与训练
H2O LLM Studio
github.com/h2oai/h2o-llmstudio
H2O 开源的 LLM 微调框架和无代码 GUI,支持多种大模型,5K+ stars
🎯零代码微调大语言模型
llm.c
github.com/karpathy/llm.c
Karpathy 用纯 C 和 CUDA 实现的 LLM 训练项目,摆脱 Python 依赖,追求极致性能
🎯大模型微调与训练
LlamaFactory
github.com/hiyouga/LlamaFactory
统一高效微调 100+ 大模型,71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架(ACL 2024 论文收录)
🎯大模型微调与训练