X-AnyLabeling

开源多模态 & 视觉 › 图像生成⭐ 9.7k↑+5

AI 辅助的数据标注工具，9.2K+ stars。集成 Segment Anything 等多种 AI 模型，支持图像标注、目标检测、实例分割、姿态估计等多种标注任务

🎯适用场景：多模态内容理解与生成

#数据标注#计算机视觉#SAM#目标检测

📥 收录于 2026/5/28

访问工具

📊 仓库数据

Stars9,732

Forks1,053

语言Python

更新2026/7/12

📈 Stars 变化 ↑23 小时 +5· 统计区间 7/11 18:09 → 7/12 17:23（23 小时）

✅ 优点

•AI 辅助标注效率高
•支持多种标注任务
•集成 SAM 等先进模型
•界面友好

⚠️ 限制

•需要一定标注经验
•大规模标注仍需人工审核
•部分高级功能学习曲线

🔗 相关工具

Deep Live Cam

开源⭐ 95k↑+23

github.com/hacksider/Deep-Live-Cam

实时人脸替换工具，91,252+ stars。仅需一张照片即可实现实时视频换脸和一键视频 Deepfake，基于 AI 视觉模型实现高精度面部替换。支持摄像头实时预览和离线视频处理，是 AI 换脸领域最受欢迎的开源项目。

🎯多模态内容理解与生成

#Deepfake#人脸替换#计算机视觉#实时

语言Python

🍴 Forks13,825

📅 上线2024/3/15

🔄 更新2026/7/12

📥 收录2026/4/21

openpilot

开源⭐ 63k↑+12

github.com/commaai/openpilot

自动驾驶操作系统，60,671+ stars。comma.ai 开源的高级驾驶辅助系统（ADAS），支持 275+ 款车型的自适应巡航、车道保持等自动驾驶辅助功能

🎯多模态内容理解与生成

#自动驾驶#ADAS#汽车#计算机视觉

语言Python

🍴 Forks11,153

📅 上线2016/11/24

🔄 更新2026/7/12

📥 收录2026/4/20

Face Recognition

开源⭐ 57k↑+2

github.com/ageitgey/face_recognition

人脸识别 API，56,311+ stars。世界最简单的人脸识别 Python 库，基于 dlib 深度学习模型，提供命令行和编程接口，支持人脸识别、比对、定位等功能

🎯多模态内容理解与生成

#人脸识别#Python#dlib#计算机视觉

语言Python

🍴 Forks13,697

📅 上线2017/3/4

🔄 更新2026/7/12

📥 收录2026/4/20

rerun

开源⭐ 11k↑+4

github.com/rerun-io/rerun

多模态数据可视化 SDK，11K+ stars。用于记录、存储、查询和可视化多模态和多速率数据的开源 SDK，Rust 编写

🎯机器人控制、仿真与边缘部署、多模态内容理解与生成

#计算机视觉#cpp#多模态#python+1

语言Rust

🍴 Forks793

🔄 更新2026/7/11

📥 收录2026/5/7

introtodeeplearning

开源⭐ 8.7k

github.com/MITDeepLearning/introtodeeplearning

MIT 深度学习入门课程实验材料，涵盖计算机视觉、自然语言处理、强化学习等核心领域。包含 Jupyter Notebook 实验代码和教学视频，是学习深度学习实践的优质资源。8.6K+ stars。

🎯深度学习入门学习、AI 概念实践验证、教学参考

#计算机视觉#深度学习#Deep-reinforcement-learning#Deeplearning

语言Jupyter Notebook

🍴 Forks4,547

🔄 更新2026/7/11

📥 收录2026/6/3

FFmpeg

开源⭐ 62k↑+30

github.com/FFmpeg/FFmpeg

FFmpeg 多媒体处理框架的增强版本，60K+ stars。支持音视频转码、剪辑、滤镜、流媒体等全功能，是视频 AI 处理和多媒体应用的底层基础设施

🎯AI 视频预处理、音视频转码剪辑、多媒体流处理

#audio#c#ffmpeg#fft+1

语言C

🍴 Forks14,011

🔄 更新2026/7/12

📥 收录2026/5/22

← 浏览全部 1282 个工具