Deep Research

开源RAG & 检索4.6k

支持任意 LLM 的深度研究工具——可使用任何大语言模型进行自主深度研究。支持 SSE API 和 MCP 服务器,兼容 OpenAI、Anthropic、Gemini、DeepSeek、Grok 和 Ollama。4.6K+ stars

🎯适用场景:自主深度研究、竞品调研、技术文档自动搜集

#深度研究#多模型#MCP 服务器#SSE API#自主研究

📥 收录于 2026/6/2

📊 仓库数据

Stars4,594
Forks1,056
语言JavaScript
协议MIT
更新2026/4/22

优点

  • 兼容几乎所有 LLM 后端
  • MCP 服务器可被其他 Agent 调用
  • SSE API 流式输出
  • MIT 开源许可

⚠️ 限制

  • 主要面向英文内容研究
  • 研究质量依赖底层模型
  • 复杂研究仍需人工介入

🔗 相关工具

LobeHub

开源78k↑+13

github.com/lobehub/lobe-chat

AI Agent 协作平台,75,393+ stars。提供现代化的聊天界面,支持多模型切换、插件系统、Agent 团队协作、知识库管理,是个人 AI 工作台的优秀选择

🎯企业知识库问答与 RAG 检索

#AI 聊天#多模型#Agent 协作#开源
语言TypeScript
🍴 Forks15,356
🔄 更新2026/6/1
📥 收录2026/4/20

Cherry Studio

开源47k↑+6

github.com/CherryHQ/cherry-studio

AI 生产力工作室,43,887+ stars。集智能聊天、自动 Agent、知识库管理于一体的 AI 效率工具,支持多模型切换和插件扩展,打造个人专属 AI 工作台

🎯企业知识库问答与 RAG 检索

#AI 助手#多模型#Agent#知识库
语言TypeScript
🍴 Forks4,434
📅 上线2024/5/24
🔄 更新2026/6/1
📥 收录2026/4/20

GPT-Researcher

开源27k↑+2

github.com/assafelovic/gpt-researcher

GPT-Researcher 是一个自主研究 Agent,能够针对任意主题进行深度研究。它会自动规划搜索策略、收集多来源信息、交叉验证事实、生成结构化研究报告。26,600+ stars,支持 Google、Bing、Tavily 等多种搜索引擎,可以生成 Markdown、PDF、Word 格式的研究报告。适用于学术研究、市场分析、竞品调研等需要深度信息搜集和分析的场景。

🎯知识库问答与 RAG 检索

#开源#自主研究#信息搜集#报告生成+1
语言Python
🍴 Forks3,692
🔄 更新2026/6/1
📥 收录2026/4/23

Deep Searcher

开源7.8k1

github.com/zilliztech/deep-searcher

开源版 Deep Research——对私有数据进行深度研究和检索。Python 编写,支持语义搜索、多跳推理和结构化报告生成,是 Perplexity/Google Search 的私有数据替代方案

🎯知识库问答与 RAG 检索

#深度研究#私有数据#语义搜索#多跳推理
语言Python
🍴 Forks759
📅 上线2025/6/1
🔄 更新2026/6/1
📥 收录2026/5/26

MarkItDown

开源138k↑+707

github.com/microsoft/markitdown

微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议

🎯多模态内容理解与生成

#文件转换#Markdown#数据预处理#OCR
语言Python
🍴 Forks9,414
📅 上线2023/2/8
🔄 更新2026/6/1
📥 收录2026/4/13

Firecrawl

免费+付费127k↑+96

github.com/firecrawl/firecrawl

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯网页自动化与数据采集

#爬虫#API#LLM数据源#Markdown
语言TypeScript
🍴 Forks7,604
📅 上线2024/4/15
🔄 更新2026/6/1
📥 收录2026/4/13