Image Extender
AI 图片扩展工具,1K+ stars。基于 Gemini + OpenRouter,支持任意方向无缝扩展图片,采用 Poisson 混合技术实现自然过渡。
🎯适用场景:AI 生成图片的无缝扩展和修复
📥 收录于 2026/6/19
📊 仓库数据
✅ 优点
- •基于 Gemini 模型
- •Poisson 混合技术
- •支持任意方向扩展
⚠️ 限制
- •需要 OpenRouter API
- •处理大图片较慢
🔗 相关工具
IOPaint
github.com/Sanster/IOPaint
由 SOTA AI 模型驱动的图像修复工具,支持移除不需要的物体、缺陷、人物,或擦除图片中的任何元素,提供浏览器界面
🎯用 AI 移除图片中不需要的元素或修复缺陷
Open Source Rover
github.com/nasa-jpl/open-source-rover
NASA 开源火星车,9279 stars。基于 NASA 火星车的 DIY 六轮开源机器人项目,包含完整的硬件和软件设计
🎯机器人控制、仿真与边缘部署
Deep Live Cam
github.com/hacksider/Deep-Live-Cam
实时人脸替换工具,91,252+ stars。仅需一张照片即可实现实时视频换脸和一键视频 Deepfake,基于 AI 视觉模型实现高精度面部替换。支持摄像头实时预览和离线视频处理,是 AI 换脸领域最受欢迎的开源项目。
🎯多模态内容理解与生成
openpilot
github.com/commaai/openpilot
自动驾驶操作系统,60,671+ stars。comma.ai 开源的高级驾驶辅助系统(ADAS),支持 275+ 款车型的自适应巡航、车道保持等自动驾驶辅助功能
🎯多模态内容理解与生成
FFmpeg
github.com/FFmpeg/FFmpeg
FFmpeg 多媒体处理框架的增强版本,60K+ stars。支持音视频转码、剪辑、滤镜、流媒体等全功能,是视频 AI 处理和多媒体应用的底层基础设施
🎯AI 视频预处理、音视频转码剪辑、多媒体流处理
Face Recognition
github.com/ageitgey/face_recognition
人脸识别 API,56,311+ stars。世界最简单的人脸识别 Python 库,基于 dlib 深度学习模型,提供命令行和编程接口,支持人脸识别、比对、定位等功能
🎯多模态内容理解与生成