X-AnyLabeling
AI 辅助的数据标注工具,9.2K+ stars。集成 Segment Anything 等多种 AI 模型,支持图像标注、目标检测、实例分割、姿态估计等多种标注任务
🎯适用场景:多模态内容理解与生成
📥 收录于 2026/5/28
📊 仓库数据
📈 Stars 变化 ↑2 天 +14· 统计区间 6/10 18:12 → 6/12 07:02(2 天)
✅ 优点
- •AI 辅助标注效率高
- •支持多种标注任务
- •集成 SAM 等先进模型
- •界面友好
⚠️ 限制
- •需要一定标注经验
- •大规模标注仍需人工审核
- •部分高级功能学习曲线
🔗 相关工具
Deep Live Cam
github.com/hacksider/Deep-Live-Cam
实时人脸替换工具,91,252+ stars。仅需一张照片即可实现实时视频换脸和一键视频 Deepfake,基于 AI 视觉模型实现高精度面部替换。支持摄像头实时预览和离线视频处理,是 AI 换脸领域最受欢迎的开源项目。
🎯多模态内容理解与生成
openpilot
github.com/commaai/openpilot
自动驾驶操作系统,60,671+ stars。comma.ai 开源的高级驾驶辅助系统(ADAS),支持 275+ 款车型的自适应巡航、车道保持等自动驾驶辅助功能
🎯多模态内容理解与生成
Face Recognition
github.com/ageitgey/face_recognition
人脸识别 API,56,311+ stars。世界最简单的人脸识别 Python 库,基于 dlib 深度学习模型,提供命令行和编程接口,支持人脸识别、比对、定位等功能
🎯多模态内容理解与生成
rerun
github.com/rerun-io/rerun
多模态数据可视化 SDK,11K+ stars。用于记录、存储、查询和可视化多模态和多速率数据的开源 SDK,Rust 编写
🎯机器人控制、仿真与边缘部署、多模态内容理解与生成
introtodeeplearning
github.com/MITDeepLearning/introtodeeplearning
MIT 深度学习入门课程实验材料,涵盖计算机视觉、自然语言处理、强化学习等核心领域。包含 Jupyter Notebook 实验代码和教学视频,是学习深度学习实践的优质资源。8.6K+ stars。
🎯深度学习入门学习、AI 概念实践验证、教学参考
FFmpeg
github.com/FFmpeg/FFmpeg
FFmpeg 多媒体处理框架的增强版本,60K+ stars。支持音视频转码、剪辑、滤镜、流媒体等全功能,是视频 AI 处理和多媒体应用的底层基础设施
🎯AI 视频预处理、音视频转码剪辑、多媒体流处理