ai-engineering-hub

开源RAG & 检索36k

深入教程合集,涵盖大语言模型、RAG 技术和实际 AI 智能体应用的完整学习指南,适合开发者快速上手实践。

🎯适用场景:大语言模型、RAG 和 AI 智能体教程学习

#rag

📥 收录于 2026/6/4

📊 仓库数据

Stars35,516
更新2026/5/21

优点

  • 35,516 stars
  • 最近推送: 2026-05-21

⚠️ 限制

  • 内容更新频率取决于作者贡献
  • 部分教程可能偏向特定框架版本

🔗 相关工具

GraphRAG

开源33k↑+9

github.com/microsoft/graphrag

微软开源的基于知识图谱的 RAG 系统,将传统向量检索升级为图谱推理,大幅提升复杂问答的准确性和可解释性。

🎯知识图谱增强 RAG、大规模文档社区摘要与全局推理

#rag#knowledge-graph#microsoft#retrieval+1
语言Python
🍴 Forks3,538
🔄 更新2026/6/4
📥 收录2026/5/11

WeKnora

开源16k↑+16

github.com/Tencent/WeKnora

腾讯开源的 LLM 知识平台,15K+ stars。将原始文档转化为可查询的 RAG、自主推理 Agent 和自我维护的 Wiki。是端到端知识管理的全栈方案

🎯企业知识库构建与 AI 问答

#agent#agentic#knowledge-base#rag+1
语言Go
🍴 Forks2,051
🔄 更新2026/6/4
📥 收录2026/5/29

R2R

开源7.9k

github.com/sciphi-ai/r2r

生产级 AI 检索系统,7839 stars。最先进的生产级 AI 检索系统,支持 Agentic RAG 和 RESTful API 接口

🎯知识库问答与 RAG 检索

#artificial-intelligence#large-language-models#python#question-answering+1
语言Python
🍴 Forks629
🔄 更新2026/6/3
📥 收录2026/5/7

Vespa

免费6.9k↑+1

github.com/vespa-engine/vespa

AI + 数据在线服务,8.5K+ stars。AI 和数据在线服务平台,支持大规模向量搜索和机器学习推理,https://vespa.ai

🎯向量检索与语义搜索

#ai#big-data#java#machine-learning+1
语言Java
🍴 Forks717
📅 上线2016/6/3
🔄 更新2026/6/4
📥 收录2026/5/12

MarkItDown

开源143k↑+346

github.com/microsoft/markitdown

微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议

🎯多模态内容理解与生成

#文件转换#Markdown#数据预处理#OCR
语言Python
🍴 Forks9,778
📅 上线2023/2/8
🔄 更新2026/6/4
📥 收录2026/4/13

Firecrawl

免费+付费128k↑+94

github.com/firecrawl/firecrawl

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯网页自动化与数据采集

#爬虫#API#LLM数据源#Markdown
语言TypeScript
🍴 Forks7,647
📅 上线2024/4/15
🔄 更新2026/6/4
📥 收录2026/4/13