Roboflow Supervision

开源多模态 & 视觉 › 计算机视觉⭐ 48k↑+49

可复用的计算机视觉工具库，39.7K+ stars。提供目标检测、实例分割、图像分类等 CV 任务的评估指标和可视化工具，兼容 YOLO、SAM 等主流模型

🎯适用场景：多模态内容理解与生成

#计算机视觉#目标检测#实例分割#评估指标

📥 收录于 2026/5/28

访问工具

📊 仓库数据

Stars47,841

Forks4,470

语言Python

更新2026/7/12

📈 Stars 变化 ↑23 小时 +49· 统计区间 7/11 18:09 → 7/12 17:23（23 小时）

✅ 优点

•CV 评估标准工具集
•兼容主流检测模型
•可视化效果优秀
•API 设计清晰

⚠️ 限制

•仅覆盖计算机视觉场景
•部分高级功能需企业版
•文档以英文为主

🔗 相关工具

OpenCV

开源⭐ 90k↑+16

github.com/opencv/opencv

开源计算机视觉库，87,181+ stars。全球最广泛使用的计算机视觉库，提供 2500+ 优化算法，涵盖图像处理、目标检测、人脸识别、相机标定等领域。支持 C++、Python、Java，是 AI 视觉应用的基石。

🎯多模态内容理解与生成

#计算机视觉#图像处理#目标检测#开源

语言C++

🍴 Forks56,690

📅 上线2012/5/1

🔄 更新2026/7/12

📥 收录2026/4/21

Ultralytics

开源⭐ 59k↑+36

github.com/ultralytics/ultralytics

YOLO 系列目标检测框架，56,193+ stars。业界最先进的目标检测框架，支持 YOLOv8/v11 等最新模型，提供检测、分割、姿态估计、旋转框检测等任务，API 简洁易用

🎯多模态内容理解与生成

#目标检测#YOLO#计算机视觉#深度学习

语言Python

🍴 Forks11,357

📅 上线2022/9/12

🔄 更新2026/7/12

📥 收录2026/4/20

YOLOv5

开源⭐ 58k↑+4

github.com/ultralytics/yolov5

YOLOv5 目标检测，57,248+ stars。Ultralytics 出品的实时目标检测模型，以速度和精度著称，支持多种模型规模（Nano 到 XLarge），广泛应用于工业视觉、安防监控等场景

🎯多模态内容理解与生成

#目标检测#计算机视觉#实时推理#Ultralytics

语言Python

🍴 Forks17,488

📅 上线2020/5/18

🔄 更新2026/7/12

📥 收录2026/4/20

kornia

开源⭐ 11k↓-1

github.com/kornia/kornia

几何计算机视觉库，11K+ stars。面向空间 AI 的几何计算机视觉库，提供 OpenCV 风格的 PyTorch 原生计算机视觉操作

🎯多模态内容理解与生成

#人工智能#计算机视觉#深度学习#hacktoberfest+1

语言Python

🍴 Forks1,199

🔄 更新2026/7/11

📥 收录2026/5/7

PaddleOCR

开源⭐ 85k↑+55

github.com/PaddlePaddle/PaddleOCR

百度开源的多语言 OCR 工具，75,995+ stars。支持 80+ 语言识别，提供超轻量级中文 OCR 模型（仅几 MB），可部署于服务器、移动端和嵌入式设备，是工业级 OCR 方案的首选

🎯多模态内容理解与生成

#OCR#多语言#轻量级#工业级

语言Python

🍴 Forks11,007

📅 上线2020/5/8

🔄 更新2026/7/12

📥 收录2026/4/20

Tesseract OCR

开源⭐ 75k↑+21

github.com/tesseract-ocr/tesseract

开源 OCR 引擎，73,620+ stars。由 HP 开发、Google 维护的顶级文字识别引擎，支持 100+ 语言，可识别图片、PDF、扫描件中的文字。结合 LSTM 神经网络实现高精度 OCR，是 AI 文档处理的基础设施。

🎯多模态内容理解与生成

#OCR#文字识别#文档处理#多语言

语言C++

🍴 Forks10,687

📅 上线2015/1/1

🔄 更新2026/7/12

📥 收录2026/4/21

← 浏览全部 1282 个工具