UniVLA
UniVLA 是 OpenDriveLab 开发的统一视觉-语言-动作模型框架,面向自动驾驶和机器人领域。通过多模态融合实现端到端的决策能力。
🎯适用场景:自动驾驶决策、机器人控制、多模态感知
📥 收录于 2026/6/3
📊 仓库数据
✅ 优点
- •统一的 VLA 架构设计
- •OpenDriveLab 数据支持
- •端到端决策能力
⚠️ 限制
- •需要大量训练数据
- •实际部署算力要求高
🔗 相关工具
robosuite
github.com/ARISE-Initiative/robosuite
模块化机器人学习仿真框架与基准测试平台,支持多种机器人操作任务的仿真和评估
🎯机器人操作学习、强化学习仿真、机器人基准测试
robocasa
github.com/robocasa/robocasa
RoboCasa 是 NVIDIA 开源的机器人模拟器,专注于家庭环境中的通用机器人操作任务。提供基于 Isaac Sim 的逼真物理仿真和 50+ 机器人任务场景,支持强化学习和模仿学习。
🎯家庭机器人操作训练、强化学习策略开发、物理仿真环境搭建
Transformers
github.com/huggingface/transformers
Hugging Face 核心模型库,159,648+ stars。支持 200K+ 预训练模型,覆盖 NLP、计算机视觉、音频、多模态等全领域,提供统一 API 接口,是 AI 开发者的必备基础设施
🎯多模型 API 统一接入与路由
LangChain
github.com/langchain-ai/langchain
最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施
🎯LLM 应用快速开发
Supabase
github.com/supabase/supabase
Postgres 开发平台,101,199+ stars。开源 Firebase 替代方案,内置向量数据库支持 pgvector,是构建 AI 应用(RAG、Agent)的理想后端基础设施。提供实时数据库、认证、存储、Edge Functions 等全栈能力。
🎯LLM 应用快速开发
immich
github.com/immich-app/immich
高性能自托管照片视频管理,5.5K+ stars。高性能自托管照片和视频管理方案,支持 AI 人脸识别、场景分类和智能搜索
🎯LLM 应用快速开发