Oumi

开源训练 & 微调9.2k↑+2

端到端 LLM/VLM 训练平台,9.2K+ stars。支持 SFT/DPO/评估/部署全流程,兼容 Gemma、Qwen、DeepSeek-R1 等最新模型。提供简洁 API 和预置配方,大幅降低 LLM 微调门槛

🎯适用场景:大模型微调与训练

#LLM 训练#SFT#DPO#模型部署

📊 仓库数据

Stars9,239
Forks767
语言Python
上线2024/5/7
更新2026/5/21

📈 上次抓取以来 ↑+2

优点

  • 训练评估部署一站式
  • 兼容最新开源模型
  • API 设计简洁
  • 预置训练配方

⚠️ 限制

  • 相对较新项目
  • 大规模训练仍需调优
  • 文档仍在完善中

🔗 相关工具

Axolotl

开源12k

github.com/axolotl-ai-cloud/axolotl

LLM 微调训练工具,12K+ stars。支持 LoRA/QLoRA/全参数微调、DPO/ORPO 等对齐方法,兼容 Llama、Mistral、Qwen 等主流模型。提供 YAML 配置驱动的训练流程,是 LLM 微调的事实标准工具之一

🎯 大模型微调与训练

#LLM 微调#LoRA#DPO#训练工具
语言Python
🍴 Forks1,347
📅 上线2023/4/14
🔄 更新2026/5/20

LLaMA Factory

开源72k↑+2

github.com/hiyouga/LLaMA-Factory

100+ 大模型高效微调工具,71K+ stars。支持 LoRA、QLoRA、DPO、PPO 等 10+ 种微调方法,提供 WebUI 一键式微调界面,兼容 LLaMA、Mistral、Qwen、Baichuan 等主流模型。ACL 2024 论文收录

🎯 大模型微调与训练

#LLM#微调#LoRA#WebUI
语言Python
🍴 Forks8,723
📅 上线2023/4/1
🔄 更新2026/5/23

Unsloth

开源65k↑+15

github.com/unslothai/unsloth

LLM 微调 Web UI 和优化工具,62,269+ stars。提供 2 倍训练速度、70% 显存占用的 LLM 微调方案,支持 Llama、Mistral、Qwen 等主流模型的 LoRA/QLoRA 微调

🎯 大模型微调与训练

#LLM微调#LoRA#显存优化#Web UI
语言Python
🍴 Forks5,767
📅 上线2023/11/29
🔄 更新2026/5/23

Keras

开源64k↑+1

github.com/keras-team/keras

深度学习框架,64,020+ stars。高级神经网络 API,支持 TensorFlow、JAX、PyTorch 多后端。以用户友好著称,让深度学习从实验到生产的转化变得简单高效

🎯 大模型微调与训练

#深度学习#神经网络#多后端#TensorFlow
语言Python
🍴 Forks19,774
📅 上线2015/3/28
🔄 更新2026/5/23

nanoGPT

开源59k↑+5

github.com/karpathy/nanoGPT

Karpathy 打造的训练和微调中小型 GPT 的最简最快实现,适合学习 LLM 内部原理

🎯 大模型微调与训练

#llm#training#gpt#教育
语言Python
🍴 Forks10,093
🔄 更新2026/5/23

nanoChat

开源54k↑+6

github.com/karpathy/nanochat

Karpathy 用 100 美元能买到的最佳 ChatGPT 体验,从数据到训练到推理的完整实现

🎯 大模型微调与训练

#llm#chat#training#karpathy
语言Python
🍴 Forks7,294
🔄 更新2026/5/23