DataDesigner
NVIDIA NeMo 数据设计工具,可从零生成或基于种子数据生成高质量合成数据,适用于模型训练和微调
🎯适用场景:合成数据生成、模型训练数据增强、微调数据准备
📥 收录于 2026/6/3
📊 仓库数据
✅ 优点
- •NVIDIA 官方出品
- •支持 MCP 协议
- •数据质量高
⚠️ 限制
- •依赖 NVIDIA 生态
- •合成数据需要人工审核
🔗 相关工具
ai-agents-from-scratch
github.com/pguso/ai-agents-from-scratch
通过从零构建 AI Agent 的方式深入讲解大模型 Agent 的原理,涵盖本地 LLM 部署、函数调用、记忆管理和 ReAct 模式等核心概念。
🎯学习 AI Agent 的底层原理和实现方法
Transformers
github.com/huggingface/transformers
Hugging Face 核心模型库,159,648+ stars。支持 200K+ 预训练模型,覆盖 NLP、计算机视觉、音频、多模态等全领域,提供统一 API 接口,是 AI 开发者的必备基础设施
🎯多模型 API 统一接入与路由
LangChain
github.com/langchain-ai/langchain
最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施
🎯LLM 应用快速开发
Supabase
github.com/supabase/supabase
Postgres 开发平台,101,199+ stars。开源 Firebase 替代方案,内置向量数据库支持 pgvector,是构建 AI 应用(RAG、Agent)的理想后端基础设施。提供实时数据库、认证、存储、Edge Functions 等全栈能力。
🎯LLM 应用快速开发
immich
github.com/immich-app/immich
高性能自托管照片视频管理,5.5K+ stars。高性能自托管照片和视频管理方案,支持 AI 人脸识别、场景分类和智能搜索
🎯LLM 应用快速开发
LlamaFactory
github.com/hiyouga/LlamaFactory
统一高效微调 100+ 大模型,71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架(ACL 2024 论文收录)
🎯大模型微调与训练