PaddleNLP

开源开发框架13k

百度飞桨开源的NLP工具库,提供丰富的大语言模型和小语言模型资源,支持分布式训练、模型压缩和多种NLP任务。

🎯适用场景:NLP模型训练与部署、中文文本处理、信息抽取

#bert#compression#distributed-training#document-intelligence

📊 仓库数据

Stars12,947
Forks3,040
语言Python
协议Apache-2.0
更新2026/5/23

优点

  • 百度官方维护,模型资源丰富
  • 中文NLP任务支持完善
  • 支持分布式训练和模型压缩

⚠️ 限制

  • 社区活跃度不及HuggingFace
  • 部分高级功能文档不够完善

🔗 相关工具

Transformers

开源161k↑+11

github.com/huggingface/transformers

Hugging Face 核心模型库,159,648+ stars。支持 200K+ 预训练模型,覆盖 NLP、计算机视觉、音频、多模态等全领域,提供统一 API 接口,是 AI 开发者的必备基础设施

🎯 多模型 API 统一接入与路由

#模型库#NLP#多模态#Hugging Face
语言Python
🍴 Forks33,299
📅 上线2018/10/29
🔄 更新2026/5/23

LangChain

开源137k↑+24

github.com/langchain-ai/langchain

最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施

🎯 LLM 应用快速开发

#RAG#Agent#链式编排#生态最大
语言Python
🍴 Forks22,738
📅 上线2022/10/17
🔄 更新2026/5/23

Supabase

开源103k↑+6

github.com/supabase/supabase

Postgres 开发平台,101,199+ stars。开源 Firebase 替代方案,内置向量数据库支持 pgvector,是构建 AI 应用(RAG、Agent)的理想后端基础设施。提供实时数据库、认证、存储、Edge Functions 等全栈能力。

🎯 LLM 应用快速开发

#PostgreSQL#向量数据库#AI 后端#全栈
语言TypeScript
🍴 Forks12,518
📅 上线2020/10/1
🔄 更新2026/5/23

immich

开源101k↑+15

github.com/immich-app/immich

高性能自托管照片视频管理,5.5K+ stars。高性能自托管照片和视频管理方案,支持 AI 人脸识别、场景分类和智能搜索

🎯 LLM 应用快速开发

#backup-tool#flutter#google-photos#google-photos-alternative+1
语言TypeScript
🍴 Forks5,666
📅 上线2022/2/3
🔄 更新2026/5/23

LlamaFactory

开源72k↑+7

github.com/hiyouga/LlamaFactory

统一高效微调 100+ 大模型,71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架(ACL 2024 论文收录)

🎯 大模型微调与训练

#agent#ai#deepseek#fine-tuning+1
语言Python
🍴 Forks8,722
📅 上线2023/5/28
🔄 更新2026/5/23

annotated_deep_learning_paper_implementations

开源67k↑+1

github.com/labmlai/annotated_deep_learning_paper_implementations

60+ 深度学习论文实现,5.3K+ stars。带注释和讲解的深度学习论文实现合集,帮助理解论文原理和代码

🎯 AI 技术学习与实践教程

#attention#deep-learning#deep-learning-tutorial#gan+1
语言Python
🍴 Forks6,707
📅 上线2020/8/25
🔄 更新2026/5/23