MobileGym
移动端 GUI Agent 研究与评测平台,提供可验证、高并行的模拟环境。内置浏览器端安卓模拟器,支持大规模在线强化学习训练和可复现的评估,是移动 Agent 研究的基础设施。641 stars。
🎯适用场景:移动 GUI Agent 研究与训练——提供标准化评测环境和大规模 RL 训练能力,适合 AI Agent 研究者和开发者
📥 收录于 2026/6/22
📊 仓库数据
📈 Stars 变化 ↑6 小时 +1· 统计区间 6/24 00:08 → 6/24 06:11(6 小时)
✅ 优点
- •浏览器端安卓模拟器创新性强
- •支持大规模并行训练
- •可验证的评估框架
⚠️ 限制
- •社区较小
- •主要面向研究场景
- •部署复杂度较高
🔗 相关工具
Agent S
github.com/simular-ai/Agent-S
开源的类人计算机操作 Agent 框架,11K+ stars。结合计算机界面理解、上下文强化学习和记忆检索,让 Agent 像人类一样使用电脑,支持跨平台桌面自动化操作
🎯多模态内容理解与生成
Apache Airflow
github.com/apache/airflow
Apache 顶级项目,AI 工作流编排的事实标准,45K+ stars。以 DAG 方式定义、调度和监控复杂数据处理管道——支持 ML 训练管道编排、模型推理任务调度、数据 ETL 等,是生产级 AI 基础设施的核心组件
🎯分布式 ML 训练与推理调度、AI 数据管道编排
OmniParser
github.com/microsoft/omniparser
微软屏幕解析工具,将屏幕元素转化为结构化数据,为纯视觉 GUI Agent 提供输入
🎯机器人控制、仿真与边缘部署
Bytebot
github.com/bytebot-ai/bytebot
自托管 AI 桌面 Agent,11K+ stars。通过自然语言命令自动化完成电脑操作任务,是本地化 Computer Use Agent 的新选择
🎯本地化桌面任务自动化,如文件操作、浏览器自动化、批量数据处理
RobotGo
github.com/go-vgo/robotgo
Go 原生跨平台 RPA 自动化工具,支持 GUI 控制、屏幕截图、键鼠模拟和窗口操作,可与 AI Agent 结合实现 Computer Use 场景的自动化交互
🎯AI Agent 的 Computer Use 底层 GUI 操作、跨平台桌面自动化测试
Microsoft Fara-7B
github.com/microsoft/fara
微软开源的高效 Computer Use Agent 模型,仅 7B 参数即可实现桌面操作。在 Computer Use 基准测试中表现优异,是轻量化 GUI Agent 的新选择,5.2K stars
🎯轻量级桌面操作自动化,适合单 GPU 即可部署的 Computer Use Agent 场景