Midscene

开源MCP 生态 › 浏览器自动化⭐ 14k↑+6

AI 驱动的视觉驱动 UI 自动化框架，13K+ stars。通过视觉理解而非 DOM 定位来操作网页，支持跨平台 UI 自动化测试和 RPA 场景，是 Browser Use 之外另一个视觉 AI 自动化方案

🎯适用场景：跨平台 UI 自动化测试和 RPA 场景——通过视觉理解操作网页，无需依赖 DOM 结构，适合动态 UI 和复杂网页的自动化测试。

#AI 自动化#视觉驱动#UI 测试#浏览器自动化

📥 收录于 2026/5/30

访问工具

📊 仓库数据

Stars14,055

Forks1,072

语言TypeScript

更新2026/7/14

📈 Stars 变化 ↑13 小时 +6· 统计区间 7/13 23:54 → 7/14 13:02（13 小时）

✅ 优点

•视觉驱动而非 DOM 定位，适配动态 UI 变化
•支持跨平台自动化，兼容多种浏览器和框架
•AI 语义理解能力强，可处理非标准 UI 元素

⚠️ 限制

•视觉识别依赖截图质量，极端分辨率下可能失效
•相比传统 DOM 定位速度稍慢，不适合高频操作场景

🔗 相关工具

Browser Use

开源⭐ 105k↑+84

github.com/browser-use/browser-use

让 AI Agent 控制浏览器的开源框架，101K+ stars。支持自动化浏览网页、点击、填写表单、提取数据，是构建 Web Agent 的基础设施。0.13 版本引入 Rust 核心和 beta agent。

🎯网页自动化与数据采集

#浏览器自动化#Web Agent#Playwright

语言Python

🍴 Forks11,529

📅 上线2024/11/1

🔄 更新2026/7/14

📥 收录2026/4/19

Agent Browser

开源⭐ 38k↑+29

github.com/vercel-labs/agent-browser

Vercel 出品的 AI Agent 浏览器自动化 CLI 工具。允许 AI Agent 直接控制浏览器执行复杂任务——网页浏览、表单填写、数据抓取、SPA 应用交互等。30,300+ stars，基于 Playwright 构建，提供简洁的命令行接口让 AI Agent 以人类方式操作浏览器。与 browser-use 相比，agent-browser 更专注于 AI Agent 场景的集成，提供更流畅的 Agent-浏览器交互体验。

🎯网页自动化与数据采集

#开源#浏览器自动化#命令行#Playwright+1

语言Rust

🍴 Forks2,484

🔄 更新2026/7/14

📥 收录2026/4/23

Playwright MCP

开源⭐ 35k↑+10

github.com/microsoft/playwright-mcp

微软官方 Playwright MCP 服务器，让 AI Agent 通过 MCP 协议控制浏览器执行点击、输入、导航等操作。33K+ stars，是浏览器自动化和 Web Agent 场景的标准 MCP 实现

🎯AI Agent 通过 MCP 控制浏览器完成自动化测试与网页操作

#mcp#playwright#浏览器自动化#Web Agent

语言TypeScript

🍴 Forks2,909

🔄 更新2026/7/14

📥 收录2026/5/27

browser

开源⭐ 32k↑+13

github.com/lightpanda-io/browser

Lightpanda 无头浏览器，6.2K+ stars。专为 AI 和自动化设计的无头浏览器，提供轻量高效的网页访问能力

🎯MCP 工具协议集成

#无头浏览器#浏览器自动化#Lightpanda#AI Agent

语言Zig

🍴 Forks1,409

📅 上线2023/2/7

🔄 更新2026/7/14

📥 收录2026/5/17

CloakBrowser

开源⭐ 28k↑+20

github.com/CloakHQ/CloakBrowser

通过所有机器人检测的隐形 Chromium 浏览器。Playwright 直接替代品，源码级指纹补丁，30/30 检测测试通过。是 AI Agent 网页自动化的反检测基础设施

🎯网页自动化与数据采集

#反检测#浏览器自动化#Playwright#AI Agent

语言Python

🍴 Forks2,261

📅 上线2026/2/22

🔄 更新2026/7/14

📥 收录2026/5/18

Web UI

开源⭐ 16k↑+1

github.com/browser-use/web-ui

Browser Use 出品的浏览器 AI Agent Web 界面，16K+ stars。让用户直接在浏览器中运行 AI Agent，支持网页浏览、表单填写、数据提取等自动化操作

🎯网页自动化与数据采集

#浏览器自动化#Web Agent#浏览器界面#AI 操作

语言Python

🍴 Forks2,712

🔄 更新2026/7/14

📥 收录2026/5/28

← 浏览全部 1285 个工具