开源数据标注工具,10K+ stars。NTT 出品,支持文本分类、序列标注、情感分析等多种 NLP 标注任务,提供直观的 Web 界面和协作标注功能,是构建 AI 训练数据集的基础设施。

🎯适用场景:NLP 训练数据的标注和质量审核

#数据标注#自然语言处理#文本分类#协作

📥 收录于 2026/5/29

📊 仓库数据

Stars10,670
Forks1,828
语言Python
更新2026/6/6

优点

  • 支持多种标注任务类型
  • Web 界面友好支持多人协作
  • 可导出标准格式便于后续处理

⚠️ 限制

  • 更新频率较低功能迭代慢
  • 不支持图像/视频等多模态标注

🔗 相关工具

Label Studio

开源28k+2

github.com/humansignal/label-studio

数据标注工具,6K+ stars。多类型数据标注和注释工具,支持图像、文本、音频、视频的标准化标注输出

🎯多模态数据标注、训练数据集构建与质检

#数据标注#MLOps#计算机视觉#多模态
语言TypeScript
🍴 Forks3,566
📅 上线2019/6/19
🔄 更新2026/6/8
📥 收录2026/5/17

Transformers

开源161k+11

github.com/huggingface/transformers

Hugging Face 核心模型库,159,648+ stars。支持 200K+ 预训练模型,覆盖 NLP、计算机视觉、音频、多模态等全领域,提供统一 API 接口,是 AI 开发者的必备基础设施

🎯多模型 API 统一接入与路由

#模型库#自然语言处理#多模态#Hugging Face
语言Python
🍴 Forks33,443
📅 上线2018/10/29
🔄 更新2026/6/9
📥 收录2026/4/20

Firecrawl

免费+付费130k+127

github.com/firecrawl/firecrawl

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯网页自动化与数据采集

#爬虫#API#LLM数据源#Markdown
语言TypeScript
🍴 Forks7,723
📅 上线2024/4/16
🔄 更新2026/6/9
📥 收录2026/4/13

Zed

开源85k+27

github.com/zed-industries/zed

高性能 Rust 编写的代码编辑器,原生支持 AI 辅助编程、实时协作编辑和 GPU 加速渲染,追求极致速度和流畅体验

🎯日常代码编辑、AI 辅助编程、多人实时协作开发

#editor#Rust#AI 编程#协作+1
语言Rust
🍴 Forks8,970
🔄 更新2026/6/9
📥 收录2026/6/6

AFFiNE

开源69k+9

github.com/toeverything/affine

开源、本地优先、隐私友好的 Notion 和 Miro 替代品,集知识库、文档、白板、数据库于一体的全功能工作空间

🎯个人/团队知识库搭建、文档管理、白板协作、替代 Notion

#知识库#wiki#notion-alternative#local-first+1
语言TypeScript
🍴 Forks4,914
🔄 更新2026/6/9
📥 收录2026/6/7

OpenBB Platform

开源69k+11

github.com/openbb-finance/openbb

金融数据分析平台,66,139+ stars。开源金融数据基础设施,提供股票、加密货币、宏观经济等全方位数据查询和分析能力,支持 Python SDK 和终端使用

🎯金融数据采集与分析、股票与宏观数据查询

#金融数据#股票分析#Python#开源
语言Python
🍴 Forks6,937
📅 上线2020/12/20
🔄 更新2026/6/9
📥 收录2026/4/20