引言:AI Agent 的最后一公里
2026 年 4 月 8 日,Anthropic 在 Claude Platform 上正式公测发布了 Claude Managed Agents——一套用于构建和部署云端托管 AI Agent 的可组合 API 套件。这不是一个新模型,而是一个全新的产品类别:AI Agent 生产化基础设施。
Anthropic 的公告直击要害:"构建 Agent 意味着你要把开发周期花在安全沙箱、状态管理、权限控制上,还要为每次模型升级重写 Agent 循环。Managed Agents 用内置的编排引擎(Harness)搭配生产级基础设施,让你从原型到上线只需要几天,而不是几个月。"
这句话背后隐藏着一个深刻的行业判断:AI Agent 的核心瓶颈从来不是模型能力,而是工程基础设施。
为什么我们需要 Managed Agents
Agent 开发的真实成本
在 Managed Agents 出现之前,构建一个生产级 AI Agent 需要解决以下基础设施问题:
- 沙箱代码执行环境:Agent 需要安全地运行代码,不能让它访问宿主机的文件系统或网络
- 状态持久化与检查点:Agent 可能运行数小时,需要保存中间状态以应对断连和重启
- 凭据管理:Agent 访问外部 API 需要安全的密钥存储和轮换机制
- 细粒度权限控制:不同 Agent 需要不同级别的系统访问权限
- 端到端追踪:生产环境要求记录每一次工具调用、每一个决策路径
- 错误恢复机制:Agent 调用工具失败时如何优雅地重试或降级
以上每一项单独拎出来都可能需要数周的开发工作。而它们与 Agent 的核心业务逻辑毫无关系——纯粹的基础设施开销。
Anthropic 的方案:让专业的人做专业的事
Claude Managed Agents 的核心哲学很简单:你定义 Agent 的任务、工具和安全护栏,我们负责在 Anthropic 的基础设施上运行它。
具体来说,内置的编排引擎(Harness)自动处理:
- 何时调用工具
- 如何管理上下文窗口
- 如何从错误中恢复
- 如何在长时间运行中保持状态
核心特性深度剖析
特性一:生产级沙箱与安全执行
Managed Agents 为每个 Agent 提供安全的沙箱环境,包括:
- 隔离的代码执行容器:Agent 的代码运行在完全隔离的环境中,无法访问宿主系统
- 内置身份认证:Agent 访问外部服务时使用托管的身份凭证,开发者无需自行管理密钥
- 工具执行审计:每一次工具调用都被完整记录,包括输入、输出和执行时间
这与 Anthropic 此前在 Claude Code 中展示的架构一脉相承。Claude Code 已经证明了 Anthropic 在 Agent 基础设施上的工程能力,Managed Agents 则是将这套能力产品化、服务化。
特性二:长时间运行会话
这是 Managed Agents 最具差异化的特性之一。传统的 Agent 框架(如 LangChain、AutoGen)通常假设 Agent 在短时间内完成单个任务,而 Managed Agents 设计用于:
- 自主运行数小时:Agent 可以长时间独立工作,无需人类实时监督
- 断连状态持久化:即使网络断开或客户端掉线,Agent 的进度和输出也会完整保留
- 渐进式任务完成:Agent 可以分阶段完成复杂任务,每阶段产出都是可检验的中间成果
Anthropic 官方博客明确指出,Managed Agents 适用于那些"需要较长时间完成、需要大量工具调用、受益于持久化文件和对话数据"的任务场景。
特性三:多 Agent 协同(研究预览)
这是一个尚未完全开放但令人兴奋的特性。Managed Agents 支持:
- Agent 生成 Agent:一个 Agent 可以动态启动并指挥其他 Agent
- 并行化复杂工作:主 Agent 可以将大任务拆分为子任务,分派给多个子 Agent 并行执行
- 结果聚合:主 Agent 收集子 Agent 的产出并进行整合
这种层级式多 Agent 架构正是 OpenClaw 等现代 Agent 框架的核心设计模式。Anthropic 将其作为原生基础设施提供,意味着开发者不再需要自行实现复杂的 Agent 编排逻辑。
特性四:可信治理
对于企业级部署,安全治理是刚需。Managed Agents 提供:
- 作用域权限管理:每个 Agent 只能访问被明确授权的系统资源
- 身份管理:Agent 有独立的身份标识,可以追踪到具体操作
- 执行追踪:完整的审计日志,包括所有工具调用、决策路径和输出结果
技术架构分析
根据 Anthropic 公布的架构设计,Claude Managed Agents 的核心组件包括:
- 编排引擎(Harness):这是大脑,决定何时调用工具、如何管理上下文、如何处理错误
- 沙箱执行环境:这是手脚,安全地执行代码和工具调用
- 状态管理层:这是记忆,维护会话状态、检查点和持久化数据
- 治理层:这是免疫系统,确保权限、身份和审计
这种分层设计使得各组件可以独立演进,同时保持整体的协调性。
性能数据:内部测试验证
Anthropic 在官方公告中披露了一个关键数据:在结构化文件生成的内部测试中,Managed Agents 比标准提示词循环的任务成功率提升了高达 10 个百分点,且在最困难的问题上提升幅度最大。
这个数据非常有意义。它表明编排引擎不仅仅是一个基础设施封装,而是真正提升了 Agent 的表现质量——这得益于 Anthropic 在 Harness 层面针对 Claude 模型特性做的深度优化。
早期采用者案例
Notion:团队协作中的 Agent 部署
Notion 将 Managed Agents 集成到其 Custom Agents 功能中。工程师用它来交付代码,知识工作者用它来生成网站和演示文稿。数十个任务可以并行运行,整个团队可以在输出上协作。
Rakuten:跨部门 Agent 矩阵
Rakuten 在产品销售、营销和财务部门部署了企业级 Agent,这些 Agent 接入 Slack 和 Teams,员工可以分配任务并获取电子表格、幻灯片和应用等交付物。每个专业 Agent 都在一周内部署完成。
Asana:AI 队友
Asana 构建了 AI Teammates——与人类在项目中协同工作的协作式 AI Agent。使用 Managed Agents 后,他们交付高级功能的速度大幅提升。
Sentry:从 bug 到修复的自动化流水线
Sentry 将其 Seer 调试 Agent 与 Claude 驱动的修复 Agent 配对,开发者可以从标记的 bug 直接到可审查的修复 PR,整个流程一气呵成。这个集成在数周内完成,而不是数月。
Vibecode:AI 原生应用工厂
Vibecode 使用 Managed Agents 作为默认集成,帮助用户从提示词到部署应用。他们的联合创始人表示:"以前用户需要手动在沙箱中运行 LLM、管理生命周期、配备工具并监督执行,这个过程需要数周或数月。现在,只需几行代码,用户就能以至少 10 倍的速度启动相同的基础设施。"
定价与商业模式
Managed Agents 采用消耗定价:
- 标准 Claude Platform Token 费率适用
- 额外的运行时费用:每小时 0.08 美元(活跃运行时间)
这个定价策略值得注意:每小时 0.08 美元的运行费用非常低,意味着 Anthropic 更关心的是 Token 消耗带来的收入,而非基础设施本身的利润。这实际上是在降低 Agent 部署的门槛,加速生态扩张。
竞争格局:为什么这件事很重要
OpenAI 的对比
OpenAI 也有类似的 Agent 平台(如 Assistants API),但 Claude Managed Agents 的差异化在于:
- 内置编排引擎:不只是 API 封装,而是智能的 Agent 循环管理
- 多 Agent 原生支持:层级式多 Agent 协作是一等公民
- Claude 模型深度优化:Harness 针对 Claude 的 agentic 能力做了特别调优
开源框架的对比
LangChain、AutoGen、CrewAI 等开源框架提供了 Agent 开发的灵活性,但生产部署仍需自建基础设施。Managed Agents 的价值主张是:如果你不想自己搭建这些基础设施,我们可以帮你托管。
对行业的影响
Managed Agents 的发布标志着 AI Agent 开发正在经历一个关键的范式转变:
第一阶段(2023-2024):实验性 Agent——开发者用 LangChain 等框架搭建原型
第二阶段(2025-2026):生产级 Agent——企业开始部署,但需要自建基础设施
第三阶段(2026+):托管 Agent——基础设施被抽象为托管服务,开发者专注于业务逻辑
Managed Agents 正在推动行业从第二阶段向第三阶段过渡。
潜在风险与挑战
供应商锁定
Managed Agents 是 Anthropic 专有服务。一旦你的 Agent 深度依赖其沙箱、状态管理和编排引擎,迁移到其他平台将非常困难。这是所有托管服务的固有 trade-off。
安全边界
虽然 Anthropic 提供了沙箱和权限管理,但让 AI Agent 访问真实系统(数据库、API、文件存储)始终存在安全风险。Agent 是否会被 prompt injection 攻击利用?沙箱是否绝对安全?这些问题需要持续验证。
成本可控性
长时间运行的 Agent 可能产生大量 Token 消耗。对于复杂的多 Agent 协作场景,Token 成本可能迅速增长。企业需要建立有效的成本监控和预算控制机制。
结论:AI Agent 的基础设施时刻
Claude Managed Agents 的发布不仅仅是一个新产品,它代表了一个更重要的信号:AI Agent 的基础设施正在成熟。
就像 AWS 将服务器基础设施抽象为可消耗的服务,Managed Agents 正在将 Agent 基础设施抽象为可消耗的 API。这意味着:
- 开发者可以专注于定义 Agent 做什么,而不是如何做
- 企业可以更快地将 Agent 从概念验证推向生产
- 行业可以更快地迭代和改进 Agent 的应用场景
对于 AI Master Site 的读者来说,最值得关注的不是这个产品本身,而是它背后的趋势:当 Agent 的基础设施变得足够简单时,真正的创新浪潮才会到来。
产品来源:Anthropic, Claude Platform, April 8, 2026
官方公告:Claude Managed Agents — get to production 10x faster
定价文档:Claude Platform Pricing