GraphRAG
微软开源的基于知识图谱的 RAG 系统,将传统向量检索升级为图谱推理,大幅提升复杂问答的准确性和可解释性。
📊 仓库数据
🔗 相关工具
LightRAG
开源⭐ 35kgithub.com/hkuds/lightrag
[EMNLP2025] "LightRAG: Simple and Fast Retrieval-Augmented Generation"
R2R
开源⭐ 7.8kgithub.com/sciphi-ai/r2r
SoTA production-ready AI retrieval system. Agentic Retrieval-Augmented Generation (RAG) with a RESTful API.
Vespa
免费⭐ 6.9kgithub.com/vespa-engine/vespa
AI + Data, online. https://vespa.ai
MarkItDown
开源⭐ 118k↑+412github.com/microsoft/markitdown
微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议
🎯 文档格式转换、内容预处理
Firecrawl
免费+付费⭐ 113k↑+173github.com/firecrawl/firecrawl
AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源
🎯 RAG 系统数据源、AI 训练数据收集、网站内容提取
RAGFlow
开源⭐ 79k↑+63github.com/infiniflow/ragflow
开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案
🎯 企业知识库问答、文档智能检索、RAG 应用开发