X-AnyLabeling

AI 辅助的数据标注工具,9.2K+ stars。集成 Segment Anything 等多种 AI 模型,支持图像标注、目标检测、实例分割、姿态估计等多种标注任务

🎯适用场景:多模态内容理解与生成

#数据标注#计算机视觉#SAM#目标检测

📥 收录于 2026/5/28

📊 仓库数据

Stars9,393
Forks1,010
语言Python
更新2026/6/12

📈 Stars 变化 2 天 +14· 统计区间 6/10 18:12 → 6/12 07:02(2 天)

优点

  • AI 辅助标注效率高
  • 支持多种标注任务
  • 集成 SAM 等先进模型
  • 界面友好

⚠️ 限制

  • 需要一定标注经验
  • 大规模标注仍需人工审核
  • 部分高级功能学习曲线

🔗 相关工具

Deep Live Cam

开源94k+49

github.com/hacksider/Deep-Live-Cam

实时人脸替换工具,91,252+ stars。仅需一张照片即可实现实时视频换脸和一键视频 Deepfake,基于 AI 视觉模型实现高精度面部替换。支持摄像头实时预览和离线视频处理,是 AI 换脸领域最受欢迎的开源项目。

🎯多模态内容理解与生成

#Deepfake#人脸替换#计算机视觉#实时
语言Python
🍴 Forks13,680
📅 上线2024/3/15
🔄 更新2026/6/12
📥 收录2026/4/21

openpilot

开源61k+18

github.com/commaai/openpilot

自动驾驶操作系统,60,671+ stars。comma.ai 开源的高级驾驶辅助系统(ADAS),支持 275+ 款车型的自适应巡航、车道保持等自动驾驶辅助功能

🎯多模态内容理解与生成

#自动驾驶#ADAS#汽车#计算机视觉
语言Python
🍴 Forks10,975
📅 上线2016/11/24
🔄 更新2026/6/12
📥 收录2026/4/20

Face Recognition

开源56k+6

github.com/ageitgey/face_recognition

人脸识别 API,56,311+ stars。世界最简单的人脸识别 Python 库,基于 dlib 深度学习模型,提供命令行和编程接口,支持人脸识别、比对、定位等功能

🎯多模态内容理解与生成

#人脸识别#Python#dlib#计算机视觉
语言Python
🍴 Forks13,701
📅 上线2017/3/4
🔄 更新2026/6/11
📥 收录2026/4/20

rerun

开源11k+1

github.com/rerun-io/rerun

多模态数据可视化 SDK,11K+ stars。用于记录、存储、查询和可视化多模态和多速率数据的开源 SDK,Rust 编写

🎯机器人控制、仿真与边缘部署、多模态内容理解与生成

#计算机视觉#cpp#多模态#python+1
语言Rust
🍴 Forks763
🔄 更新2026/6/11
📥 收录2026/5/7

introtodeeplearning

开源8.7k+1

github.com/MITDeepLearning/introtodeeplearning

MIT 深度学习入门课程实验材料,涵盖计算机视觉、自然语言处理、强化学习等核心领域。包含 Jupyter Notebook 实验代码和教学视频,是学习深度学习实践的优质资源。8.6K+ stars。

🎯深度学习入门学习、AI 概念实践验证、教学参考

#计算机视觉#深度学习#Deep-reinforcement-learning#Deeplearning
语言Jupyter Notebook
🍴 Forks4,534
🔄 更新2026/6/11
📥 收录2026/6/3

FFmpeg

开源61k+47

github.com/FFmpeg/FFmpeg

FFmpeg 多媒体处理框架的增强版本,60K+ stars。支持音视频转码、剪辑、滤镜、流媒体等全功能,是视频 AI 处理和多媒体应用的底层基础设施

🎯AI 视频预处理、音视频转码剪辑、多媒体流处理

#audio#c#ffmpeg#fft+1
语言C
🍴 Forks13,894
🔄 更新2026/6/12
📥 收录2026/5/22