FalkorDB

开源RAG & 检索4.5k

超高速图数据库,4.4K+ stars。基于 GraphBLAS 的稀疏邻接矩阵图表示,专为 GraphRAG 和 LLM 知识图谱设计。Cypher 兼容,是 Neo4j 之外的高性能图数据库选择

🎯适用场景:知识库问答与 RAG 检索

#图数据库#GraphRAG#知识图谱#Cypher

📊 仓库数据

Stars4,458
Forks365
语言C
上线2023/7/20
更新2026/5/25

优点

  • GraphBLAS 底层高性能
  • 专为 GraphRAG 优化
  • Cypher 兼容
  • C++ 实现速度快

⚠️ 限制

  • 社区规模小于 Neo4j
  • 生态工具相对较少
  • 部分高级功能待完善

🔗 相关工具

HelixDB

开源4.6k↑+3

github.com/HelixDB/helix-db

Rust 编写的图向量数据库,4.6K stars。从底层构建的图-向量混合数据库,将图数据库的关系推理能力与向量数据库的语义检索能力融合,是 GraphRAG 场景的理想选择

🎯 GraphRAG 复杂知识图谱推理与语义检索

#图数据库#向量数据库#Rust#GraphRAG
语言Rust
🍴 Forks243
🔄 更新2026/5/25

MarkItDown

开源125k↑+37

github.com/microsoft/markitdown

微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议

🎯 多模态内容理解与生成

#文件转换#Markdown#数据预处理#OCR
语言Python
🍴 Forks8,508
📅 上线2023/2/8
🔄 更新2026/5/25

Firecrawl

免费+付费124k↑+95

github.com/firecrawl/firecrawl

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯 网页自动化与数据采集

#爬虫#API#LLM数据源#Markdown
语言TypeScript
🍴 Forks7,479
📅 上线2024/4/15
🔄 更新2026/5/25

RAGFlow

开源81k↑+13

github.com/infiniflow/ragflow

开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案

🎯 企业知识库问答与 RAG 检索、非结构化文档解析与提取

#RAG#知识库#文档检索#企业级
语言Python
🍴 Forks9,305
📅 上线2023/12/12
🔄 更新2026/5/25

LobeHub

开源78k↑+11

github.com/lobehub/lobe-chat

AI Agent 协作平台,75,393+ stars。提供现代化的聊天界面,支持多模型切换、插件系统、Agent 团队协作、知识库管理,是个人 AI 工作台的优秀选择

🎯 企业知识库问答与 RAG 检索

#AI 聊天#多模型#Agent 协作#开源
语言TypeScript
🍴 Forks15,280
🔄 更新2026/5/25

AnythingLLM

开源61k↑+8

github.com/mintplex-labs/anything-llm

本地 AI 生产力工具,58,641+ stars。一站式本地 AI 应用方案,支持文档管理、向量数据库、多模型切换,可完全本地化部署,保护数据隐私

🎯 知识库问答与 RAG 检索

#本地AI#文档问答#向量数据库#隐私保护
语言JavaScript
🍴 Forks6,559
📅 上线2023/6/4
🔄 更新2026/5/25