UI-TARS Desktop

字节跳动开源的多模态 AI Agent 桌面端框架,连接前沿 AI 模型与 Agent 基础设施,支持 GUI 自动化操作和多模态交互。

🎯适用场景:多模态内容理解与生成

#AI 智能体#多模态#gui-automation#桌面端#bytedance

📥 收录于 2026/5/11

📊 仓库数据

Stars37,363
Forks3,765
语言TypeScript
更新2026/6/28

📈 Stars 变化 6 小时 +12· 统计区间 6/28 18:12 → 6/29 00:15(6 小时)

优点

  • 多模态输入输出支持
  • 原生 Agent 编排与工具调用
  • 浏览器/桌面自动化能力
  • 可视化工作流编排
  • 35K+ stars 社区认可

⚠️ 限制

  • 需要 Node.js 环境
  • 协议生态仍在演进
  • 文档与社区支持因项目而异

🔗 相关工具

Olares

开源5.0k+8

github.com/beclab/Olares

开源个人云方案,帮助用户重新掌控自己的数据,内置 AI Agent 支持,适合家庭自动化和个人数据隐私场景。

🎯搭建个人私有云并部署本地 AI 服务

#AI 智能体#Ai-privacy#边缘 AI#Home-automation
语言Go
🍴 Forks302
🔄 更新2026/6/29
📥 收录2026/6/3

Activepieces

开源23k+3

github.com/activepieces/activepieces

AI Agent 与工作流自动化平台,内置 400 多个 MCP 服务器,可视化搭建 AI 自动化流程

🎯AI 工作流编排与自动化、MCP 工具协议集成

#自动化#智能体#工作流#mcp
语言TypeScript
🍴 Forks3,863
🔄 更新2026/6/28
📥 收录2026/5/18

Skyvern

开源22k+2

github.com/skyvern-ai/skyvern

AI 驱动浏览器自动化平台,让 AI Agent 操控浏览器完成复杂网页任务

🎯MCP 工具协议集成

#自动化#浏览器#智能体#gui
语言Python
🍴 Forks2,059
🔄 更新2026/6/28
📥 收录2026/5/18

Automa

开源21k+3

github.com/automaapp/automa

可视化浏览器自动化浏览器扩展,通过拖拽连接功能块构建网页工作流。零代码门槛,支持 Chrome 和 Firefox 双端,提供丰富的预置模块和 AI 增强能力,适合非技术人员使用。

🎯可视化浏览器自动化——拖拽式工作流构建器,适合非技术人员也能用的网页自动化场景

#浏览器扩展#可视化自动化#工作流#低代码
语言Vue
🍴 Forks2,338
🔄 更新2026/6/28
📥 收录2026/5/27

taipy

开源19k-1

github.com/Avaiga/taipy

由 Avaiga 开发的 Python 数据科学应用框架,能快速将数据管道和 AI 算法转化为生产级 Web 应用,内置任务调度、场景管理和数据可视化能力,适合数据科学团队使用。(19K+ stars)

🎯数据流水线 Web 化、AI 模型展示平台、数据仪表盘构建、场景模拟管理

#自动化#数据工程#data-integration#data-ops+1
语言Python
🍴 Forks1,983
📅 上线2022/2/18
🔄 更新2026/6/28
📥 收录2026/5/21

Microsoft Magentic-UI

开源9.9k+1

github.com/microsoft/magentic-ui

微软实验性 Agent,可跨浏览器和本地文件系统协同工作。支持网页操作、文件读写、任务规划等综合能力,是微软在通用 Agent 方向的最新探索,9.8K stars

🎯浏览器自动化 + 本地文件协同操作,适合需要跨浏览器和本地环境的复杂任务自动化场景

#微软#跨浏览器 Agent#文件系统#实验性
语言Python
🍴 Forks994
🔄 更新2026/6/28
📥 收录2026/5/27