DataDesigner

开源开发框架1.9k

NVIDIA NeMo 数据设计工具,可从零生成或基于种子数据生成高质量合成数据,适用于模型训练和微调

🎯适用场景:合成数据生成、模型训练数据增强、微调数据准备

#Agentic-ai#Data-augmentation#Data-generation#Llm

📥 收录于 2026/6/3

📊 仓库数据

Stars1,946
Forks178
语言Python
更新2026/6/3

优点

  • NVIDIA 官方出品
  • 支持 MCP 协议
  • 数据质量高

⚠️ 限制

  • 依赖 NVIDIA 生态
  • 合成数据需要人工审核

🔗 相关工具

ai-agents-from-scratch

开源4.2k↑+1

github.com/pguso/ai-agents-from-scratch

通过从零构建 AI Agent 的方式深入讲解大模型 Agent 的原理,涵盖本地 LLM 部署、函数调用、记忆管理和 ReAct 模式等核心概念。

🎯学习 AI Agent 的底层原理和实现方法

#Ai-agents#Educational#Function-calling#Llm
语言JavaScript
🍴 Forks612
🔄 更新2026/6/3
📥 收录2026/6/3

Transformers

开源161k↑+13

github.com/huggingface/transformers

Hugging Face 核心模型库,159,648+ stars。支持 200K+ 预训练模型,覆盖 NLP、计算机视觉、音频、多模态等全领域,提供统一 API 接口,是 AI 开发者的必备基础设施

🎯多模型 API 统一接入与路由

#模型库#NLP#多模态#Hugging Face
语言Python
🍴 Forks33,396
📅 上线2018/10/29
🔄 更新2026/6/3
📥 收录2026/4/20

LangChain

开源138k↑+13

github.com/langchain-ai/langchain

最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施

🎯LLM 应用快速开发

#RAG#Agent#链式编排#生态最大
语言Python
🍴 Forks22,937
📅 上线2022/10/17
🔄 更新2026/6/3
📥 收录2026/4/11

Supabase

开源103k↑+12

github.com/supabase/supabase

Postgres 开发平台,101,199+ stars。开源 Firebase 替代方案,内置向量数据库支持 pgvector,是构建 AI 应用(RAG、Agent)的理想后端基础设施。提供实时数据库、认证、存储、Edge Functions 等全栈能力。

🎯LLM 应用快速开发

#PostgreSQL#向量数据库#AI 后端#全栈
语言TypeScript
🍴 Forks12,624
📅 上线2020/10/1
🔄 更新2026/6/3
📥 收录2026/4/21

immich

开源103k↑+17

github.com/immich-app/immich

高性能自托管照片视频管理,5.5K+ stars。高性能自托管照片和视频管理方案,支持 AI 人脸识别、场景分类和智能搜索

🎯LLM 应用快速开发

#backup-tool#flutter#google-photos#google-photos-alternative+1
语言TypeScript
🍴 Forks5,786
📅 上线2022/2/3
🔄 更新2026/6/3
📥 收录2026/5/20

LlamaFactory

开源72k↑+1

github.com/hiyouga/LlamaFactory

统一高效微调 100+ 大模型,71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架(ACL 2024 论文收录)

🎯大模型微调与训练

#agent#ai#deepseek#fine-tuning+1
语言Python
🍴 Forks8,783
📅 上线2023/5/28
🔄 更新2026/6/3
📥 收录2026/5/20