MindSearch

开源RAG & 检索6.9k↑+1

基于 LLM 的多 Agent 网络搜索引擎(类似 Perplexity.ai Pro 和 SearchGPT)。通过多 Agent 协作实现深度搜索、信息整合和引用溯源,是开源 AI 搜索的新选择

🎯适用场景:知识库问答与 RAG 检索

#AI 搜索#多 Agent#Perplexity 替代#深度搜索

📥 收录于 2026/5/26

📊 仓库数据

Stars6,869
Forks687
语言JavaScript
上线2024/6/1
更新2026/6/6

📈 上次抓取以来 ↑+1

优点

  • 多 Agent 协作深度搜索
  • 引用溯源确保可信度
  • InternLM 团队出品
  • Perplexity 开源替代

⚠️ 限制

  • 搜索质量依赖底层 LLM
  • 需要配置搜索引擎 API
  • 大规模并发性能待验证

🔗 相关工具

Swirl Search

开源3.0k

github.com/swirlai/swirl-search

AI 搜索与 RAG 引擎,3K+ stars。无需迁移数据即可从 100+ 应用的企业知识库中获得即时答案。数据原地保留,隐私安全,是构建企业级 RAG 系统的轻量方案

🎯企业级 AI 搜索与知识检索系统构建

#AI 搜索#RAG#企业知识库#100+ 数据源
语言Python
🍴 Forks284
🔄 更新2026/6/1
📥 收录2026/5/22

MarkItDown

开源146k↑+211

github.com/microsoft/markitdown

微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议

🎯多模态内容理解与生成

#文件转换#Markdown#数据预处理#OCR
语言Python
🍴 Forks10,017
📅 上线2023/2/8
🔄 更新2026/6/6
📥 收录2026/4/13

Firecrawl

免费+付费130k↑+91

github.com/firecrawl/firecrawl

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯网页自动化与数据采集

#爬虫#API#LLM数据源#Markdown
语言TypeScript
🍴 Forks7,699
📅 上线2024/4/15
🔄 更新2026/6/6
📥 收录2026/4/13

LLM App

开源114k

github.com/pathwaycom/llm-app

RAG 和 AI 管道模板,59,967+ stars。Pathway 提供的实时 RAG(检索增强生成)解决方案,支持流式数据处理、实时更新知识库,适合构建生产级 AI 应用

🎯企业知识库问答与 RAG 检索、数据采集与 ETL 处理

#RAG#实时数据#AI管道#知识检索
语言Python
🍴 Forks16,844
📅 上线2023/7/19
🔄 更新2026/6/6
📥 收录2026/4/20

RAGFlow

开源82k↑+10

github.com/infiniflow/ragflow

开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案

🎯企业知识库问答与 RAG 检索、非结构化文档解析与提取

#RAG#知识库#文档检索#企业级
语言Python
🍴 Forks9,455
📅 上线2023/12/12
🔄 更新2026/6/6
📥 收录2026/4/13

LobeHub

开源78k↑+17

github.com/lobehub/lobe-chat

AI Agent 协作平台,75,393+ stars。提供现代化的聊天界面,支持多模型切换、插件系统、Agent 团队协作、知识库管理,是个人 AI 工作台的优秀选择

🎯企业知识库问答与 RAG 检索

#AI 聊天#多模型#Agent 协作#开源
语言TypeScript
🍴 Forks15,382
🔄 更新2026/6/6
📥 收录2026/4/20