AutoRAG
RAG 自动化优化框架,4.7K+ stars。开源的 RAG 评估与优化框架,采用 AutoML 风格自动化调优 RAG 管道的各个组件(分块、嵌入、检索、生成等)
🎯适用场景:RAG 管道组件选型与超参搜索,提升检索问答准确率
📥 收录于 2026/5/27
📊 仓库数据
📈 上次抓取以来 ↑+1 ⭐
✅ 优点
- •AutoML 风格自动搜索 RAG 最优组合
- •覆盖分块/检索/重排等多环节
- •评估与优化一体化
- •开源可复现实验流程
⚠️ 限制
- •搜索空间大时耗时与算力高
- •需准备高质量评测集
- •对韩语社区起源,中文文档相对少
- •生产环境需将最优配置工程化落地
🔗 相关工具
MarkItDown
github.com/microsoft/markitdown
微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议
🎯多模态内容理解与生成
Firecrawl
github.com/firecrawl/firecrawl
AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源
🎯网页自动化与数据采集
LLM App
github.com/pathwaycom/llm-app
RAG 和 AI 管道模板,59,967+ stars。Pathway 提供的实时 RAG(检索增强生成)解决方案,支持流式数据处理、实时更新知识库,适合构建生产级 AI 应用
🎯企业知识库问答与 RAG 检索、数据采集与 ETL 处理
RAGFlow
github.com/infiniflow/ragflow
开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案
🎯企业知识库问答与 RAG 检索、非结构化文档解析与提取
LobeHub
github.com/lobehub/lobe-chat
AI Agent 协作平台,75,393+ stars。提供现代化的聊天界面,支持多模型切换、插件系统、Agent 团队协作、知识库管理,是个人 AI 工作台的优秀选择
🎯企业知识库问答与 RAG 检索
MinerU
github.com/opendatalab/MinerU
MinerU 是一款开源的 PDF 文档解析与转换工具,能够将复杂的 PDF 和 Office 文档转换为 LLM 可用的 Markdown/JSON 格式。支持版面分析、表格提取、公式识别和 OCR,专为 AI 智能体工作流设计。66K+ stars。
🎯将 PDF/Office 文档转换为 AI 友好的格式,用于 RAG 知识库构建和文档智能分析