Doccano
开源数据标注工具,10K+ stars。NTT 出品,支持文本分类、序列标注、情感分析等多种 NLP 标注任务,提供直观的 Web 界面和协作标注功能,是构建 AI 训练数据集的基础设施。
🎯适用场景:NLP 训练数据的标注和质量审核
📥 收录于 2026/5/29
📊 仓库数据
✅ 优点
- •支持多种标注任务类型
- •Web 界面友好支持多人协作
- •可导出标准格式便于后续处理
⚠️ 限制
- •更新频率较低功能迭代慢
- •不支持图像/视频等多模态标注
🔗 相关工具
label-studio
github.com/humansignal/label-studio
数据标注工具,6K+ stars。多类型数据标注和注释工具,支持图像、文本、音频、视频的标准化标注输出
🎯多模态数据标注、训练数据集构建与质检
TradingAgents
github.com/TauricResearch/TradingAgents
多 Agent 金融交易框架,51,885+ stars。基于多 Agent 协作的金融交易决策框架,模拟分析师、风控师、交易员等角色协同制定交易策略
🎯多 Agent 金融交易决策、策略回测与量化投资研究
OpenBB Platform
github.com/openbb-finance/openbb
金融数据分析平台,66,139+ stars。开源金融数据基础设施,提供股票、加密货币、宏观经济等全方位数据查询和分析能力,支持 Python SDK 和终端使用
🎯金融数据采集与分析、股票与宏观数据查询
Crawl4AI
github.com/unclecode/crawl4ai
面向 AI Agent 的开源 Web 爬取框架,支持网页爬虫、Markdown 生成、JavaScript 执行和 LLM 结构化提取。为 Agent 提供可靠的 Web 数据获取能力,支持异步爬取、智能去重和内容清洗,是构建 RAG 系统和 Agent 知识库的关键基础设施
🎯企业知识库问答与 RAG 检索、网页自动化与数据采集
TrendRadar
github.com/sansan0/TrendRadar
AI 驱动的舆情监控与趋势分析助手,58K+ stars。支持多平台信息聚合、RSS 订阅、智能预警,帮助打破信息茧房,还原舆情全貌并预测未来走向,辅助决策
🎯AI 舆情监控、行业趋势分析与情报收集系统
Scrapling
github.com/D4Vinci/Scrapling
自适应 Web 爬取框架,52K+ stars。从单请求到全规模爬取全覆盖,智能处理反爬、动态渲染和复杂页面结构,是 AI Agent 数据采集的瑞士军刀
🎯AI Agent 数据采集、舆情分析数据源爬取、竞品监控自动化