ZVec
阿里巴巴开源的轻量级进程内向量数据库,极速语义检索。嵌入式设计无需独立部署,支持 HNSW 高效近似最近邻搜索,是 Agent 记忆和 RAG 系统的轻量级向量存储方案。9.6K stars
🎯适用场景:Agent 本地记忆存储、轻量级 RAG 系统、嵌入式语义搜索
📊 仓库数据
✅ 优点
- •进程内嵌入式无需部署
- •HNSW 算法检索高效
- •C++ 实现性能优异
- •Apache 2.0 开源许可
⚠️ 限制
- •不支持分布式集群
- •大规模数据集内存占用高
- •生态和工具链相对简单
🔗 相关工具
AnythingLLM
开源⭐ 59k↑+57github.com/mintplex-labs/anything-llm
本地 AI 生产力工具,58,641+ stars。一站式本地 AI 应用方案,支持文档管理、向量数据库、多模型切换,可完全本地化部署,保护数据隐私
🎯 企业文档智能问答、本地 AI 知识库、隐私敏感场景的 AI 应用
Meilisearch
开源⭐ 57k↑+6github.com/meilisearch/meilisearch
AI 混合搜索引擎,57,234+ stars。开源、快速、易用的全文搜索引擎,支持 AI 语义搜索和传统关键词搜索混合使用,毫秒级响应,提供开箱即用的搜索体验
🎯 网站搜索、产品搜索、文档检索、AI 混合搜索应用
Milvus
开源⭐ 44k↑+11github.com/milvus-io/milvus
云原生向量数据库,43,875+ stars。专为 AI 应用设计的分布式向量搜索引擎,支持千亿级向量检索,广泛应用于 RAG、推荐系统和相似性搜索场景
🎯 RAG 向量存储、推荐系统、以图搜图、语义搜索
MarkItDown
开源⭐ 118k↑+412github.com/microsoft/markitdown
微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议
🎯 文档格式转换、内容预处理
Firecrawl
免费+付费⭐ 113k↑+173github.com/firecrawl/firecrawl
AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源
🎯 RAG 系统数据源、AI 训练数据收集、网站内容提取
RAGFlow
开源⭐ 79k↑+63github.com/infiniflow/ragflow
开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案
🎯 企业知识库问答、文档智能检索、RAG 应用开发