Meilisearch
AI 混合搜索引擎,57,234+ stars。开源、快速、易用的全文搜索引擎,支持 AI 语义搜索和传统关键词搜索混合使用,毫秒级响应,提供开箱即用的搜索体验
🎯适用场景:网站搜索、产品搜索、文档检索、AI 混合搜索应用
📊 仓库数据
📈 上次抓取以来 ↑+6 ⭐
✅ 优点
- •部署极其简单
- •毫秒级搜索响应
- •AI 语义搜索支持
- •容错和拼音友好
⚠️ 限制
- •不适合超大规模数据
- •复杂查询能力不如 Elasticsearch
- •分布式方案需付费版
🔗 相关工具
MarkItDown
开源⭐ 118k↑+412github.com/microsoft/markitdown
微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议
🎯 文档格式转换、内容预处理
Firecrawl
免费+付费⭐ 113k↑+173github.com/firecrawl/firecrawl
AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源
🎯 RAG 系统数据源、AI 训练数据收集、网站内容提取
RAGFlow
开源⭐ 79k↑+63github.com/infiniflow/ragflow
开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案
🎯 企业知识库问答、文档智能检索、RAG 应用开发
LobeHub
开源⭐ 75kgithub.com/lobehub/lobe-chat
AI Agent 协作平台,75,393+ stars。提供现代化的聊天界面,支持多模型切换、插件系统、Agent 团队协作、知识库管理,是个人 AI 工作台的优秀选择
🎯 个人 AI 工作台、多模型统一入口、Agent 协作平台
LLM App
开源⭐ 60k↓4github.com/pathwaycom/llm-app
RAG 和 AI 管道模板,59,967+ stars。Pathway 提供的实时 RAG(检索增强生成)解决方案,支持流式数据处理、实时更新知识库,适合构建生产级 AI 应用
🎯 企业知识库构建、实时 RAG 应用、文档智能问答系统
AnythingLLM
开源⭐ 59k↑+57github.com/mintplex-labs/anything-llm
本地 AI 生产力工具,58,641+ stars。一站式本地 AI 应用方案,支持文档管理、向量数据库、多模型切换,可完全本地化部署,保护数据隐私
🎯 企业文档智能问答、本地 AI 知识库、隐私敏感场景的 AI 应用