Agent今天·GitHub

阿里巴巴page-agent:GitHub 19.2k星,网页内嵌AI Agent新范式

阿里巴巴开源的page-agent项目GitHub星数达19.2k,曾登上GitHub Trending第2名。该项目将AI Agent直接嵌入网页内部,用户通过自然语言命令控制页面交互。与browser-use、Playwright等外部控制方案不同,page-agent在浏览器内运行,一行代码即可为网页添加AI助手。

AI Master 解读

核心事件

阿里巴巴开源page-agent,开创【网页内嵌Agent】新范式。

行业影响

影响分析: 传统方案(browser-use、Playwright、Selenium)从外部控制浏览器,page-agent则住在网页内部。这种架构差异带来三大优势:更低延迟、更好用户体验、更易部署。

AI Master 建议

关注In-Page Agent架构,这可能成为Web应用标配能力。

阿里巴巴page-agent:网页内嵌AI Agent新范式

2026年6月,阿里巴巴开源的page-agent项目GitHub星数突破19.2k,曾登上GitHub Trending第2名,成为增长最快的AI Agent项目之一。

什么是page-agent?

page-agent是一个JavaScript库,概念简洁:在网页中添加一行脚本,AI Agent即可接管界面,通过自然语言命令执行操作。用户输入【用Acme Corp信息填写联系表单】,Agent自动执行。

架构创新

方案 控制方式 部署复杂度
browser-use/Playwright 外部进程控制 需要服务端
Selenium WebDriver协议 需要驱动配置
page-agent 网页内部运行 一行代码

核心优势

  1. 更低延迟: 无需跨进程通信
  2. 更好体验: 原生DOM操作,无闪烁
  3. 更易部署: script标签或npm包即可

技术栈

  • TypeScript编写
  • 基于browser-use的DOM处理组件
  • MIT开源协议
  • 支持自定义LLM接入