Orama

免费RAG & 检索10k

🌌 A complete search engine and RAG pipeline in your browser, server or edge ne...

#algiorithm#data-structures#full-text#javascript#node

📊 仓库数据

Stars10,337
Forks386
语言TypeScript
上线2022/5/10

🔗 相关工具

MarkItDown

开源118k↑+412

github.com/microsoft/markitdown

微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议

🎯 文档格式转换、内容预处理

#文件转换#Markdown#数据预处理#OCR
语言Python
🍴 Forks7,746
📅 上线2024/11/13
🔄 更新2026/4/27

Firecrawl

免费+付费113k↑+173

github.com/firecrawl/firecrawl

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯 RAG 系统数据源、AI 训练数据收集、网站内容提取

#爬虫#API#LLM数据源#Markdown
语言TypeScript
🍴 Forks7,175
📅 上线2024/4/15
🔄 更新2026/4/27

RAGFlow

开源79k↑+63

github.com/infiniflow/ragflow

开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案

🎯 企业知识库问答、文档智能检索、RAG 应用开发

#RAG#知识库#文档检索#企业级
语言Python
🍴 Forks8,956
📅 上线2023/12/12
🔄 更新2026/4/27

LobeHub

开源75k

github.com/lobehub/lobe-chat

AI Agent 协作平台,75,393+ stars。提供现代化的聊天界面,支持多模型切换、插件系统、Agent 团队协作、知识库管理,是个人 AI 工作台的优秀选择

🎯 个人 AI 工作台、多模型统一入口、Agent 协作平台

#AI 聊天#多模型#Agent 协作#开源
语言TypeScript
🔄 更新2026/5/14

LLM App

开源60k4

github.com/pathwaycom/llm-app

RAG 和 AI 管道模板,59,967+ stars。Pathway 提供的实时 RAG(检索增强生成)解决方案,支持流式数据处理、实时更新知识库,适合构建生产级 AI 应用

🎯 企业知识库构建、实时 RAG 应用、文档智能问答系统

#RAG#实时数据#AI管道#知识检索
语言Jupyter Notebook
🍴 Forks1,432
📅 上线2023/7/19
🔄 更新2026/4/27

AnythingLLM

开源59k↑+57

github.com/mintplex-labs/anything-llm

本地 AI 生产力工具,58,641+ stars。一站式本地 AI 应用方案,支持文档管理、向量数据库、多模型切换,可完全本地化部署,保护数据隐私

🎯 企业文档智能问答、本地 AI 知识库、隐私敏感场景的 AI 应用

#本地AI#文档问答#向量数据库#隐私保护
语言JavaScript
🍴 Forks6,382
📅 上线2023/6/4
🔄 更新2026/4/27