Doccano
开源数据标注工具,10K+ stars。NTT 出品,支持文本分类、序列标注、情感分析等多种 NLP 标注任务,提供直观的 Web 界面和协作标注功能,是构建 AI 训练数据集的基础设施。
🎯适用场景:NLP 训练数据的标注和质量审核
📥 收录于 2026/5/29
📊 仓库数据
✅ 优点
- •支持多种标注任务类型
- •Web 界面友好支持多人协作
- •可导出标准格式便于后续处理
⚠️ 限制
- •更新频率较低功能迭代慢
- •不支持图像/视频等多模态标注
🔗 相关工具
Label Studio
github.com/humansignal/label-studio
数据标注工具,6K+ stars。多类型数据标注和注释工具,支持图像、文本、音频、视频的标准化标注输出
🎯多模态数据标注、训练数据集构建与质检
Transformers
github.com/huggingface/transformers
Hugging Face 核心模型库,159,648+ stars。支持 200K+ 预训练模型,覆盖 NLP、计算机视觉、音频、多模态等全领域,提供统一 API 接口,是 AI 开发者的必备基础设施
🎯多模型 API 统一接入与路由
Firecrawl
github.com/firecrawl/firecrawl
AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源
🎯网页自动化与数据采集
Zed
github.com/zed-industries/zed
高性能 Rust 编写的代码编辑器,原生支持 AI 辅助编程、实时协作编辑和 GPU 加速渲染,追求极致速度和流畅体验
🎯日常代码编辑、AI 辅助编程、多人实时协作开发
AFFiNE
github.com/toeverything/affine
开源、本地优先、隐私友好的 Notion 和 Miro 替代品,集知识库、文档、白板、数据库于一体的全功能工作空间
🎯个人/团队知识库搭建、文档管理、白板协作、替代 Notion
OpenBB Platform
github.com/openbb-finance/openbb
金融数据分析平台,66,139+ stars。开源金融数据基础设施,提供股票、加密货币、宏观经济等全方位数据查询和分析能力,支持 Python SDK 和终端使用
🎯金融数据采集与分析、股票与宏观数据查询