Skyvern
AI 驱动浏览器自动化平台,让 AI Agent 操控浏览器完成复杂网页任务
🎯适用场景:用 AI 自动化完成浏览器中的重复性任务
📊 仓库数据
📈 上次抓取以来 ↑+6 ⭐
✅ 优点
- •AI 直接操控浏览器
- •无需 API 改造
- •支持复杂网页
⚠️ 限制
- •速度较慢
- •依赖视觉模型
🔗 相关工具
LibreChat
开源⭐ 37k↑+12github.com/danny-avila/LibreChat
增强版 ChatGPT 替代品,支持 Agent 模式、MCP 协议、多模型切换(Claude/GPT/DeepSeek 等),可自托管的通用 AI 聊天界面。
Browser Use
开源⭐ 95k↑+46github.com/browser-use/browser-use
让 AI Agent 控制浏览器的开源框架,88K+ stars。支持自动化浏览网页、点击、填写表单、提取数据,是构建 Web Agent 的基础设施
🎯 Web 自动化、AI 网页操作、数据采集
MemPalace
开源⭐ 52kgithub.com/MemPalace/mempalace
AI Agent 长期记忆系统,创新性地采用记忆宫殿架构 + AAAK 30x 压缩技术,仅需 170 token 即可启动记忆检索,在 LongMemEval 基准测试中准确率达 96.6%。完全离线运行保护隐私,支持 MCP 协议集成到任意 Agent 工作流,发布后 48 小时即获得 22K GitHub Stars。解决了大模型上下文窗口有限和记忆丢失的核心痛点,是 Agent 长期记忆基础设施的新标杆
🎯 Agent 长期记忆、跨会话上下文保持、个性化 AI 助手
Goose
开源⭐ 46k↑+14github.com/block/goose
Block 开源本地优先 AI Agent 框架,基于 MCP 协议连接 1,700+ 扩展,支持 25+ LLM 提供商,Rust 编写高性能。提供安全的沙箱执行环境和丰富的工具集成,是本地 AI Agent 开发的新选择
🎯 本地 AI Agent 开发、MCP 生态工具集成、多 LLM 灵活切换
UI-TARS Desktop
开源⭐ 35k↑+18github.com/bytedance/UI-TARS-desktop
字节跳动开源的多模态 AI Agent 桌面端框架,连接前沿 AI 模型与 Agent 基础设施,支持 GUI 自动化操作和多模态交互。
Agent Browser
开源⭐ 34k↑+41github.com/vercel-labs/agent-browser
Vercel 出品的 AI Agent 浏览器自动化 CLI 工具。允许 AI Agent 直接控制浏览器执行复杂任务——网页浏览、表单填写、数据抓取、SPA 应用交互等。30,300+ stars,基于 Playwright 构建,提供简洁的命令行接口让 AI Agent 以人类方式操作浏览器。与 browser-use 相比,agent-browser 更专注于 AI Agent 场景的集成,提供更流畅的 Agent-浏览器交互体验。
🎯 AI Agent 网页自动化、数据抓取、E2E 测试、SPA 应用交互