TurboVec
基于 TurboQuant 的向量索引,用 Rust 编写并提供 Python 绑定。高性能近似最近邻搜索,是 RAG 场景的理想向量存储选择
🎯适用场景:向量检索与语义搜索
📥 收录于 2026/5/29
📊 仓库数据
📈 上次抓取以来 ↑+118 ⭐
✅ 优点
- •Rust 高性能实现
- •AVX512 指令集优化
- •Python 绑定友好
⚠️ 限制
- •生态相对较新
- •文档待完善
🔗 相关工具
Langchain-Chatchat
github.com/chatchat-space/langchain-chatchat
Langchain-Chatchat(原 Langchain-ChatGLM),38K+ stars。基于 Langchain 和 ChatGLM、Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用,支持本地知识库问答
🎯企业知识库问答与 RAG 检索
memvid
github.com/memvid/memvid
AI Agent 记忆层,16K+ stars。用无服务器的单文件方案替代复杂的 RAG 流水线,为 AI Agent 提供持久化记忆能力
🎯知识库问答与 RAG 检索
LEANN
github.com/yichuan-w/leann
[MLsys2026] LEANN RAG 方案,12K+ stars。RAG on Everything with LEANN,享受 97% 存储节省的同时保持高性能检索
🎯知识库问答与 RAG 检索
MarkItDown
github.com/microsoft/markitdown
微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议
🎯多模态内容理解与生成
Firecrawl
github.com/firecrawl/firecrawl
AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源
🎯网页自动化与数据采集
RAGFlow
github.com/infiniflow/ragflow
开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案
🎯企业知识库问答与 RAG 检索、非结构化文档解析与提取