Agent今天·GitHub
阿里巴巴page-agent:GitHub 19.2k星,网页内嵌AI Agent新范式
阿里巴巴开源的page-agent项目GitHub星数达19.2k,曾登上GitHub Trending第2名。该项目将AI Agent直接嵌入网页内部,用户通过自然语言命令控制页面交互。与browser-use、Playwright等外部控制方案不同,page-agent在浏览器内运行,一行代码即可为网页添加AI助手。
AI Master 解读
核心事件
阿里巴巴开源page-agent,开创【网页内嵌Agent】新范式。
行业影响
影响分析: 传统方案(browser-use、Playwright、Selenium)从外部控制浏览器,page-agent则住在网页内部。这种架构差异带来三大优势:更低延迟、更好用户体验、更易部署。
AI Master 建议
关注In-Page Agent架构,这可能成为Web应用标配能力。
阿里巴巴page-agent:网页内嵌AI Agent新范式
2026年6月,阿里巴巴开源的page-agent项目GitHub星数突破19.2k,曾登上GitHub Trending第2名,成为增长最快的AI Agent项目之一。
什么是page-agent?
page-agent是一个JavaScript库,概念简洁:在网页中添加一行脚本,AI Agent即可接管界面,通过自然语言命令执行操作。用户输入【用Acme Corp信息填写联系表单】,Agent自动执行。
架构创新
| 方案 | 控制方式 | 部署复杂度 |
|---|---|---|
| browser-use/Playwright | 外部进程控制 | 需要服务端 |
| Selenium | WebDriver协议 | 需要驱动配置 |
| page-agent | 网页内部运行 | 一行代码 |
核心优势
- 更低延迟: 无需跨进程通信
- 更好体验: 原生DOM操作,无闪烁
- 更易部署: script标签或npm包即可
技术栈
- TypeScript编写
- 基于browser-use的DOM处理组件
- MIT开源协议
- 支持自定义LLM接入