nanoChat

开源训练 & 微调 › 微调框架⭐ 56k↑+10

Karpathy 用 100 美元能买到的最佳 ChatGPT 体验，从数据到训练到推理的完整实现

🎯适用场景：大模型微调与训练

#大语言模型#chat#训练#karpathy

📥 收录于 2026/5/18

访问工具 📖 官方文档

📊 仓库数据

Stars56,130

Forks7,740

语言Python

协议MIT

更新2026/7/10

📈 Stars 变化 ↑12 小时 +10· 统计区间 7/10 12:08 → 7/11 00:11（12 小时）

✅ 优点

•端到端完整实现
•极低训练成本
•Karpathy 出品

⚠️ 限制

•模型规模小
•效果有限

🔗 相关工具

LLaMA Factory

开源⭐ 73k↑+19

github.com/hiyouga/LLaMA-Factory

100+ 大模型高效微调工具，71K+ stars。支持 LoRA、QLoRA、DPO、PPO 等 10+ 种微调方法，提供 WebUI 一键式微调界面，兼容 LLaMA、Mistral、Qwen、Baichuan 等主流模型。ACL 2024 论文收录

🎯大模型微调与训练

#大语言模型#微调#LoRA#WebUI

语言Python

🍴 Forks8,936

📅 上线2023/4/1

🔄 更新2026/7/10

📥 收录2026/4/21

llm.c

开源⭐ 31k↑+6

github.com/karpathy/llm.c

Karpathy 用纯 C 和 CUDA 实现的 LLM 训练项目，摆脱 Python 依赖，追求极致性能

🎯大模型微调与训练

#大语言模型#cuda#c#performance

语言Cuda

🍴 Forks3,692

🔄 更新2026/7/10

📥 收录2026/5/18

LlamaFactory

开源⭐ 73k↑+19

github.com/hiyouga/LlamaFactory

统一高效微调 100+ 大模型，71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架（ACL 2024 论文收录）

🎯大模型微调与训练

#智能体#ai#deepseek#微调+1

语言Python

🍴 Forks8,936

📅 上线2023/5/28

🔄 更新2026/7/10

📥 收录2026/5/20

Unsloth

开源⭐ 68k↑+19

github.com/unslothai/unsloth

LLM 微调 Web UI 和优化工具，62,269+ stars。提供 2 倍训练速度、70% 显存占用的 LLM 微调方案，支持 Llama、Mistral、Qwen 等主流模型的 LoRA/QLoRA 微调

🎯大模型微调与训练

#LLM微调#LoRA#显存优化#Web UI

语言Python

🍴 Forks6,121

📅 上线2023/11/30

🔄 更新2026/7/11

📥 收录2026/4/20

PEFT

开源⭐ 21k↑+6

github.com/huggingface/peft

🤗 Hugging Face 参数高效微调库，支持 LoRA、QLoRA、AdaLoRA 等 SOTA 方法，大幅降低大模型微调成本。

🎯大语言模型低资源微调、领域适配、指令跟随训练

#微调#lora#peft#parameter-efficient-learning

语言Python

🍴 Forks2,384

🔄 更新2026/7/10

📥 收录2026/5/31

Axolotl

开源⭐ 12k↑+4

github.com/axolotl-ai-cloud/axolotl

LLM 微调训练工具，12K+ stars。支持 LoRA/QLoRA/全参数微调、DPO/ORPO 等对齐方法，兼容 Llama、Mistral、Qwen 等主流模型。提供 YAML 配置驱动的训练流程，是 LLM 微调的事实标准工具之一

🎯大模型微调与训练

#LLM 微调#LoRA#DPO#训练工具

语言Python

🍴 Forks1,389

📅 上线2023/4/14

🔄 更新2026/7/10

📥 收录2026/5/21

← 浏览全部 1267 个工具