ContextGem

开源开发框架1.8k

从文档中轻松提取 LLM 上下文,1.8K+ stars。支持合同分析、数据提取、文档智能等场景,兼容 DOCX/PDF/HTML 等多种格式

🎯适用场景:文档智能解析与 LLM 数据提取

#ai#contract-analysis#data-extraction#document-intelligence#docx

📥 收录于 2026/5/29

📊 仓库数据

Stars1,844
Forks155
语言Python
更新2026/5/29

优点

  • 文档智能提取能力强
  • 多格式支持
  • 合同分析场景适配

⚠️ 限制

  • 社区较小
  • 文档待完善

🔗 相关工具

LlamaFactory

开源72k↑+6

github.com/hiyouga/LlamaFactory

统一高效微调 100+ 大模型,71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架(ACL 2024 论文收录)

🎯大模型微调与训练

#agent#ai#deepseek#fine-tuning+1
语言Python
🍴 Forks8,760
📅 上线2023/5/28
🔄 更新2026/5/30
📥 收录2026/5/20

haystack

开源25k↑+3

github.com/deepset-ai/haystack

开源 AI 编排框架,25K+ stars。用于构建上下文工程和生产级 LLM 应用的框架,支持 RAG、Agent、语义搜索等核心能力

🎯LLM 应用快速开发

#agent#agents#ai#gemini+1
语言MDX
🍴 Forks2,816
🔄 更新2026/5/30
📥 收录2026/5/7

PaddleNLP

开源13k1

github.com/PaddlePaddle/PaddleNLP

百度飞桨开源的NLP工具库,提供丰富的大语言模型和小语言模型资源,支持分布式训练、模型压缩和多种NLP任务。

🎯NLP模型训练与部署、中文文本处理、信息抽取

#bert#compression#distributed-training#document-intelligence
语言Python
🍴 Forks3,040
🔄 更新2026/5/30
📥 收录2026/5/23

eino

开源12k↑+2

github.com/cloudwego/eino

Go 语言 LLM 应用框架,11K+ stars。Go 语言生态中最强大的 LLM/AI 应用开发框架,适合 Go 开发者构建 AI 应用

🎯LLM 应用快速开发

#ai#ai-application#ai-framework#langchain+1
语言Go
🍴 Forks942
🔄 更新2026/5/30
📥 收录2026/5/7

TaskingAI

开源5.4k

github.com/taskingai/taskingai

AI 原生应用开发平台,5381 stars。AI 原生应用开发的开源平台,支持快速构建和部署 AI 驱动的应用

🎯LLM 应用快速开发

#agent#ai#ai-native#function-call+1
语言Python
🍴 Forks356
🔄 更新2026/5/29
📥 收录2026/5/7

magic

开源4.8k

github.com/dtyq/magic

开源 AI 研究环境,5.2K+ stars。AI 研究人员的开源研究环境,无缝微调、评估和部署 AI 模型

🎯LLM 应用快速开发

#agent#agi#ai#gpt+1
语言TypeScript
🍴 Forks528
📅 上线2025/5/14
🔄 更新2026/5/30
📥 收录2026/5/20