TurboVec

开源RAG & 检索3.8k↑+118

基于 TurboQuant 的向量索引,用 Rust 编写并提供 Python 绑定。高性能近似最近邻搜索,是 RAG 场景的理想向量存储选择

🎯适用场景:向量检索与语义搜索

#ann#avx512#embedding#faiss#rust

📥 收录于 2026/5/29

📊 仓库数据

Stars3,795
Forks348
语言Python
更新2026/5/30

📈 上次抓取以来 ↑+118

优点

  • Rust 高性能实现
  • AVX512 指令集优化
  • Python 绑定友好

⚠️ 限制

  • 生态相对较新
  • 文档待完善

🔗 相关工具

Langchain-Chatchat

开源38k↑+1

github.com/chatchat-space/langchain-chatchat

Langchain-Chatchat(原 Langchain-ChatGLM),38K+ stars。基于 Langchain 和 ChatGLM、Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用,支持本地知识库问答

🎯企业知识库问答与 RAG 检索

#chatbot#chatchat#chatglm#chatgpt+1
语言Python
🍴 Forks6,212
🔄 更新2026/5/30
📥 收录2026/5/7

memvid

开源16k↑+5

github.com/memvid/memvid

AI Agent 记忆层,16K+ stars。用无服务器的单文件方案替代复杂的 RAG 流水线,为 AI Agent 提供持久化记忆能力

🎯知识库问答与 RAG 检索

#ai#context#embedded#faiss+1
语言Rust
🍴 Forks1,345
🔄 更新2026/5/30
📥 收录2026/5/7

LEANN

开源12k↑+4

github.com/yichuan-w/leann

[MLsys2026] LEANN RAG 方案,12K+ stars。RAG on Everything with LEANN,享受 97% 存储节省的同时保持高性能检索

🎯知识库问答与 RAG 检索

#ai#faiss#gpt-oss#langchain+1
语言Python
🍴 Forks1,052
🔄 更新2026/5/30
📥 收录2026/5/7

MarkItDown

开源132k↑+673

github.com/microsoft/markitdown

微软开源的通用文件转 Markdown 工具,支持 PDF、Word、PPT、Excel、HTML、音频、图片 OCR 等数十种格式转换,专为 LLM 和 RAG 数据预处理设计,插件系统可扩展,MIT 协议

🎯多模态内容理解与生成

#文件转换#Markdown#数据预处理#OCR
语言Python
🍴 Forks9,012
📅 上线2023/2/8
🔄 更新2026/5/30
📥 收录2026/4/13

Firecrawl

免费+付费126k↑+96

github.com/firecrawl/firecrawl

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯网页自动化与数据采集

#爬虫#API#LLM数据源#Markdown
语言TypeScript
🍴 Forks7,581
📅 上线2024/4/15
🔄 更新2026/5/30
📥 收录2026/4/13

RAGFlow

开源82k↑+11

github.com/infiniflow/ragflow

开源 RAG 引擎,78,566+ stars。深度融合检索与 LLM 能力,支持 PDF/Word/PPT 等多格式文档解析、智能分块、混合检索和引用溯源,是企业知识库问答的优选方案

🎯企业知识库问答与 RAG 检索、非结构化文档解析与提取

#RAG#知识库#文档检索#企业级
语言Python
🍴 Forks9,367
📅 上线2023/12/12
🔄 更新2026/5/30
📥 收录2026/4/13