Roboflow Supervision
可复用的计算机视觉工具库,39.7K+ stars。提供目标检测、实例分割、图像分类等 CV 任务的评估指标和可视化工具,兼容 YOLO、SAM 等主流模型
🎯适用场景:多模态内容理解与生成
📥 收录于 2026/5/28
📊 仓库数据
✅ 优点
- •CV 评估标准工具集
- •兼容主流检测模型
- •可视化效果优秀
- •API 设计清晰
⚠️ 限制
- •仅覆盖计算机视觉场景
- •部分高级功能需企业版
- •文档以英文为主
🔗 相关工具
OpenCV
github.com/opencv/opencv
开源计算机视觉库,87,181+ stars。全球最广泛使用的计算机视觉库,提供 2500+ 优化算法,涵盖图像处理、目标检测、人脸识别、相机标定等领域。支持 C++、Python、Java,是 AI 视觉应用的基石。
🎯多模态内容理解与生成
Ultralytics
github.com/ultralytics/ultralytics
YOLO 系列目标检测框架,56,193+ stars。业界最先进的目标检测框架,支持 YOLOv8/v11 等最新模型,提供检测、分割、姿态估计、旋转框检测等任务,API 简洁易用
🎯多模态内容理解与生成
YOLOv5
github.com/ultralytics/yolov5
YOLOv5 目标检测,57,248+ stars。Ultralytics 出品的实时目标检测模型,以速度和精度著称,支持多种模型规模(Nano 到 XLarge),广泛应用于工业视觉、安防监控等场景
🎯多模态内容理解与生成
X-AnyLabeling
github.com/CVHub520/X-AnyLabeling
AI 辅助的数据标注工具,9.2K+ stars。集成 Segment Anything 等多种 AI 模型,支持图像标注、目标检测、实例分割、姿态估计等多种标注任务
🎯多模态内容理解与生成
Deep Live Cam
github.com/hacksider/Deep-Live-Cam
实时人脸替换工具,91,252+ stars。仅需一张照片即可实现实时视频换脸和一键视频 Deepfake,基于 AI 视觉模型实现高精度面部替换。支持摄像头实时预览和离线视频处理,是 AI 换脸领域最受欢迎的开源项目。
🎯多模态内容理解与生成
openpilot
github.com/commaai/openpilot
自动驾驶操作系统,60,671+ stars。comma.ai 开源的高级驾驶辅助系统(ADAS),支持 275+ 款车型的自适应巡航、车道保持等自动驾驶辅助功能
🎯多模态内容理解与生成