ContextGem
从文档中轻松提取 LLM 上下文,1.8K+ stars。支持合同分析、数据提取、文档智能等场景,兼容 DOCX/PDF/HTML 等多种格式
🎯适用场景:文档智能解析与 LLM 数据提取
#ai#contract-analysis#data-extraction#document-intelligence#docx
📥 收录于 2026/5/29
📊 仓库数据
Stars1,844
Forks155
语言Python
更新2026/5/29
✅ 优点
- •文档智能提取能力强
- •多格式支持
- •合同分析场景适配
⚠️ 限制
- •社区较小
- •文档待完善
🔗 相关工具
LlamaFactory
开源⭐ 72k↑+6
github.com/hiyouga/LlamaFactory
统一高效微调 100+ 大模型,71K+ stars。支持 100+ LLM 和 VLM 的高效微调框架(ACL 2024 论文收录)
🎯大模型微调与训练
#agent#ai#deepseek#fine-tuning+1
语言Python
🍴 Forks8,760
📅 上线2023/5/28
🔄 更新2026/5/30
📥 收录2026/5/20
haystack
开源⭐ 25k↑+3
github.com/deepset-ai/haystack
开源 AI 编排框架,25K+ stars。用于构建上下文工程和生产级 LLM 应用的框架,支持 RAG、Agent、语义搜索等核心能力
🎯LLM 应用快速开发
#agent#agents#ai#gemini+1
语言MDX
🍴 Forks2,816
🔄 更新2026/5/30
📥 收录2026/5/7
PaddleNLP
开源⭐ 13k↓1
github.com/PaddlePaddle/PaddleNLP
百度飞桨开源的NLP工具库,提供丰富的大语言模型和小语言模型资源,支持分布式训练、模型压缩和多种NLP任务。
🎯NLP模型训练与部署、中文文本处理、信息抽取
#bert#compression#distributed-training#document-intelligence
语言Python
🍴 Forks3,040
🔄 更新2026/5/30
📥 收录2026/5/23
eino
开源⭐ 12k↑+2
github.com/cloudwego/eino
Go 语言 LLM 应用框架,11K+ stars。Go 语言生态中最强大的 LLM/AI 应用开发框架,适合 Go 开发者构建 AI 应用
🎯LLM 应用快速开发
#ai#ai-application#ai-framework#langchain+1
语言Go
🍴 Forks942
🔄 更新2026/5/30
📥 收录2026/5/7
TaskingAI
开源⭐ 5.4k
github.com/taskingai/taskingai
AI 原生应用开发平台,5381 stars。AI 原生应用开发的开源平台,支持快速构建和部署 AI 驱动的应用
🎯LLM 应用快速开发
#agent#ai#ai-native#function-call+1
语言Python
🍴 Forks356
🔄 更新2026/5/29
📥 收录2026/5/7
magic
开源⭐ 4.8k
github.com/dtyq/magic
开源 AI 研究环境,5.2K+ stars。AI 研究人员的开源研究环境,无缝微调、评估和部署 AI 模型
🎯LLM 应用快速开发
#agent#agi#ai#gpt+1
语言TypeScript
🍴 Forks528
📅 上线2025/5/14
🔄 更新2026/5/30
📥 收录2026/5/20