文章摘要
深入理解 Computer Use Agent 技术原理,对比传统 RPA 与新一代视觉智能体,掌握企业级落地实践
1什么是 Computer Use Agent?
Computer Use Agent(计算机使用智能体)是 2025-2026 年 AI 领域最具颠覆性的技术突破之一。它让 AI 模型能够像人类一样"看屏幕"并操作计算机——点击按钮、输入文字、导航页面、读取界面信息,从而完成原本需要人工操作的复杂流程。
要理解 Computer Use 的革命性,我们需要回顾自动化的演进路径:
第一代:脚本自动化——工程师编写 Python 脚本调用 API,实现系统间数据传递。这种方式依赖完善的 API 接口,对于没有开放接口的老旧系统无能为力。
第二代:RPA(Robotic Process Automation)——UiPath、Blue Prism、Automation Anywhere 等工具通过UI 元素定位(XPath、控件 ID、坐标)来模拟人工操作。RPA 解决了 API 缺失的问题,但它有一个致命弱点:极度依赖界面稳定性。页面改版、控件 ID 变更、弹窗位置偏移都会导致脚本失效。
第三代:Computer Use Agent——AI 模型通过视觉理解(截图识别)而非元素定位来操作计算机。它不需要知道按钮的 XPath 是什么,只需要"看到"屏幕上有个"提交"按钮并点击它。这从根本上解决了 RPA 的脆弱性问题。
2025 年 9 月,Anthropic 首次将 Computer Use 能力集成到 Claude 模型中(Beta 阶段),支持 2048x768 分辨率的屏幕操作。2026 年 5 月 13 日,Microsoft Copilot Studio 将 Computer Use Agent 推向正式商用(GA),搭载 OpenAI CUA 和 Claude Sonnet 4.5 两个生产级模型,成为首个主要云厂商的生产级 Computer Use 方案。来源:Microsoft 官方博客 2026 年 5 月、Digital Applied 深度分析。
💡 一句话理解
判断是否需要 Computer Use 的简单标准:你的自动化流程是否涉及没有 API 的桌面应用、老旧 Web 系统或第三方 SaaS 平台?如果是,Computer Use 是比 RPA 更合适的选择。
⚠️ 常见踩坑
Computer Use 不是万能药。对于有完善 API 的系统,直接调用 API 仍然是更快、更可靠的方式。Computer Use 的价值在于填补 API 无法覆盖的空白。
2Computer Use 的技术原理
Computer Use Agent 的核心技术栈可以分解为感知、理解、决策、执行四个模块,与通用 Agent 框架一致,但每个模块都针对屏幕操作进行了专门优化。感知模块:屏幕截图采集。 Agent 以固定频率(通常每秒 1-3 次)对目标屏幕区域进行截图。截图分辨率经过精心设计——Anthropic 的早期实现使用 2048x768,Microsoft Copilot Studio GA 版支持动态分辨率适配,根据目标应用自动调整。截图不只是全屏幕捕获,还包括焦点区域的高分辨率采样,确保按钮文字和图标清晰可辨。理解模块:视觉-语言模型解析。 截图被送入多模态 LLM(如 Claude Sonnet 4.5 或 OpenAI CUA),模型需要将像素转换为结构化理解:哪些区域是按钮?哪些是输入框?当前页面处于什么状态?这是 Computer Use 与传统 RPA 的根本区别——RPA 通过 DOM 树或控件属性"知道"按钮在哪里,而 Computer Use Agent 通过视觉模型"看到"按钮在哪里。决策模块:动作规划。 模型基于对屏幕的理解,决定下一步操作:点击坐标 (x, y)、输入文本、按键盘快捷键、滚动页面等。决策不是孤立的——模型需要维护任务上下文,记住已经执行了哪些步骤、还需要完成什么目标。执行模块:输入注入。 决定好的动作通过操作系统级别的输入注入来执行:X11/Wayland 协议(Linux)、Accessibility API(macOS)、UI Automation(Windows)。这些是操作系统原生支持的无障碍接口,无需破解或逆向工程。
整个循环以 1-3 Hz 的频率持续运行:截图 → 理解 → 决策 → 执行 → 观察结果 → 下一步。这种循环架构使得 Agent 能够处理动态变化的界面——比如弹窗突然出现、页面异步加载、表单验证失败提示等 RPA 难以处理的场景。Computer Use 的性能瓶颈分析。 从技术架构来看,Computer Use Agent 的性能瓶颈主要在三个环节:截图延迟(通常在 10-50 毫秒之间,取决于屏幕分辨率和网络条件)、模型推理延迟(单次截图理解需要 500 毫秒到 3 秒,取决于模型大小和并发负载)、以及输入注入延迟(通常在 10-30 毫秒)。其中模型推理延迟是最大的瓶颈,也是厂商竞争的核心——Anthropic 通过模型优化将推理延迟从最初的 5 秒降低到 1 秒以内,Microsoft 通过 Azure GPU 集群的弹性调度实现了动态扩缩容。
以下是一个 Computer Use Agent 核心循环的伪代码实现:
# Computer Use Agent 核心循环伪代码
class ComputerUseAgent:
"""计算机使用智能体的核心执行循环"""
def __init__(self, model, screen_capture, input_injector, max_steps=100):
self.model = model # 视觉-语言模型
self.screen = screen_capture # 屏幕截图模块
self.injector = input_injector # 输入注入模块
self.max_steps = max_steps
self.history = [] # 执行历史记录
def execute(self, goal: str) -> dict:
"""执行目标:截图→理解→决策→执行→观察的循环"""
for step in range(self.max_steps):
# 1. 感知:屏幕截图
screenshot = self.screen.capture()
# 2. 理解:视觉模型解析界面
analysis = self.model.analyze(
image=screenshot,
context=self.history,
goal=goal
)
# 3. 决策:决定下一步动作
action = analysis.decide_action()
if action.type == "DONE":
return {"status": "success", "steps": step + 1}
# 4. 执行:注入输入操作
self.injector.execute(action)
# 5. 观察:记录执行结果
self.history.append({
"step": step,
"screenshot_hash": hash(screenshot),
"action": action,
"analysis": analysis.summary
})
# 6. 变化检测:如果界面没有变化,可能需要调整策略
if not self.detect_change(screenshot):
action = self.handle_no_change()
return {"status": "timeout", "steps": self.max_steps}💡 一句话理解
性能优化关键:截图频率和分辨率是成本和效果的平衡点。频率太高浪费 token 和延迟,太低导致漏掉界面变化。生产环境建议 1.5 Hz 起步,配合变化检测(差分截图)来减少不必要的模型调用。
⚠️ 常见踩坑
视觉理解模型不是 100% 准确的。在小文字、模糊图标、动态广告等场景下可能出现误识别。关键业务操作必须加入人工确认步骤(Human-in-the-Loop)。
3Computer Use 与传统 RPA 的对比分析
理解 Computer Use 的价值,最直接的方式是把它与成熟的 RPA 技术进行系统性对比。这不是替代关系,而是适用场景的分化。
适应性方面:RPA 通过 XPath、CSS 选择器、控件 ID 来定位 UI 元素,这些标识符一旦页面改版就会失效。Computer Use 通过视觉理解定位,即使按钮从左边移到右边、从蓝色变成红色,只要人类能认出来,模型就能认出来。这是本质的鲁棒性差异。
开发成本方面:RPA 流程的开发通常需要专门的 RPA 工程师,一个中等复杂度的流程可能需要数天到数周的调试。Computer Use Agent 的开发更像"写需求文档"——用自然语言描述任务目标和规则,模型自行完成界面交互。开发时间可以从数天缩短到数小时。
运行速度方面:这是 Computer Use 的劣势。RPA 直接操作 DOM 或控件,速度接近人工操作的 10-50 倍。Computer Use 需要经历截图 → 模型推理 → 执行输入的完整循环,每次操作耗时 2-8 秒。假设一个财务对账流程需要操作 50 次界面元素,RPA 可能在 2-5 分钟内完成,而 Computer Use 可能需要 2-7 分钟。对于大批量、高频率的标准化操作,RPA 仍然更快;但对于每天只有数十到数百次操作的中等频率场景,速度差异对用户感知影响不大。
可审计性方面:RPA 有成熟的审计日志体系——每一步操作都可以精确记录(操作了哪个控件、输入了什么值)。Computer Use 的审计依赖于截图记录和模型决策日志,在合规要求极高的行业(金融、医疗)还需要额外的验证层。
成本方面:RPA 的许可费用通常是按机器人数量计算的固定成本。Computer Use 的成本与模型调用次数相关——每次截图和决策都会消耗 token。Microsoft Copilot Studio GA 版本包含在 Power Platform 许可体系中,Anthropic Computer Use 按 token 计费。高频使用场景下需要仔细评估成本模型。
| 维度 | RPA | Computer Use Agent | 选择建议 |
|---|---|---|---|
定位方式 | UI 元素选择器/XPath | 视觉理解(截图识别) | 动态界面选 CUA |
开发周期 | 数天到数周 | 数小时到数天 | 快速原型选 CUA |
运行速度 | 极快(直接操作 DOM) | 中等(2-8 秒/操作) | 高频操作选 RPA |
维护成本 | 页面变更需重写脚本 | 自动适应界面变化 | 频繁变更选 CUA |
合规审计 | 成熟(精确操作日志) | 发展中(截图+决策日志) | 强合规选 RPA |
初始投资 | 许可证费用较高 | 按 token 计费,起步低 | 小预算选 CUA |
适用场景 | 标准化、高频、有稳定 UI | 非标、低频、UI 多变 | 视场景而定 |
💡 一句话理解
混合策略是最佳实践:核心稳定流程保留 RPA(速度快、成本低),新增或变更频繁的流程使用 Computer Use Agent(开发快、适应性强)。两者通过编排层协同工作。
⚠️ 常见踩坑
不要低估 Computer Use 的 token 成本。一个复杂任务可能需要 50-200 次模型调用,每次调用消耗数万 token。在生产环境部署前必须进行成本测算。
4主流 Computer Use 平台对比
截至 2026 年 5 月,市场上已有多个 Computer Use Agent 平台进入生产阶段。以下是主要方案的对比分析。
Microsoft Copilot Studio Computer Use Agent(2026 年 5 月 13 日 GA): 微软是第一个将 Computer Use 推向正式商用的主要云厂商。GA 版本搭载两个生产级模型——OpenAI CUA 192和 Claude Sonnet 4.5——企业可以根据需求选择。关键企业功能包括:Azure Key Vault 凭据存储、Microsoft Purview 审计日志、Outlook 人工审批流程(Human-in-the-Loop)。Copilot Studio 的优势在于与 Microsoft 365 生态的深度集成——Agent 可以直接操作 Teams、Excel、SharePoint 等应用。适合已经在使用 Microsoft 生态的企业。来源:Digital Applied 深度分析。 平台选型的决策框架:在选择 Computer Use 平台时,企业应该从以下五个维度进行评估。第一是 生态兼容性——你的目标应用主要在哪个生态中运行?如果是 Microsoft 365(Excel、SharePoint、Teams),Copilot Studio 是自然选择。如果是 Linux 服务器环境,Claude Computer Use 更合适。第二是 安全合规要求——金融和医疗行业的企业需要完整的审计日志和审批流程,Copilot Studio 的 Purview 集成和 Outlook 审批流程提供了开箱即用的合规能力。第三是 开发团队技能——如果团队熟悉 Microsoft Power Platform,Copilot Studio 的学习曲线更平缓。如果团队有 Python 开发经验,Anthropic 的 API 更容易上手。第四是 成本预算——Copilot Studio 的许可费用通常包含在 Power Platform 订阅中,而 Anthropic 按 token 计费。对于高频使用场景,固定许可费用可能更经济。第五是 模型性能需求——不同模型在屏幕理解准确度上存在差异。建议在 POC 阶段用实际业务场景测试不同模型的表现,而不是仅凭基准数据做决策。Anthropic Claude Computer Use(2025 年 9 月 Preview → 2026 年集成进 Claude Agent): Anthropic 是 Computer Use 概念的首创者。Claude 的 Computer Use 能力在开发者社区中获得广泛认可,支持 Linux 环境下的屏幕操作。2026 年 3 月,Claude 3.7 Sonnet 进一步将 Computer Use 整合进 Claude Agent,支持更复杂的任务编排。Anthropic 的优势在于模型质量和安全性——Claude 的安全防护层在行业内处于领先水平。开源方案:OS-World 和 OmniParser。 学术界的 OS-World 基准测试平台和 Meta 开源的 OmniParser 为 Computer Use 提供了开源基础。适合有技术能力自行搭建的企业,但需要自行解决安全、审计和运维问题。
💡 一句话理解
选型决策树:已有 Microsoft 365 且需要企业级审计 → Copilot Studio。技术团队主导且重视模型质量 → Claude Agent。需要最大灵活性和成本控制 → 开源方案自建。
⚠️ 常见踩坑
不要仅凭演示效果做选型决策。Computer Use 在演示环境中通常表现完美,但在真实企业环境中会遇到权限问题、网络隔离、遗留系统兼容性等挑战。务必进行 POC 验证。
5企业落地实践:从 POC 到生产
将 Computer Use Agent 从概念验证推向生产环境,需要系统化的方法论。以下是经过验证的落地路径。
第一阶段:场景筛选(1-2 周)。 不是所有自动化场景都适合 Computer Use。适合的场景特征包括:涉及无 API 的桌面或 Web 应用、操作频率不高(每天数十到数百次)、界面相对稳定但有小幅变化、出错后果可控。不适合的场景:毫秒级响应要求、每秒数千次操作、涉及核心交易系统且零容错。筛选标准应该是"人工做太慢、RPA 做太脆弱"的中间地带。第二阶段:POC 验证(2-4 周)。 选取 1-2 个典型场景进行概念验证。关键验证指标:成功率(Agent 能否在 95% 以上的场景中完成任务)、异常处理(遇到弹窗、错误提示、网络超时时能否恢复)、成本(单次任务的 token 消耗和模型调用费用)、速度(端到端耗时是否在可接受范围内)。POC 阶段不要追求完美——重点是验证技术可行性。POC 验证的关键技术挑战: 在 POC 阶段,团队最常遇到的三个技术挑战需要特别关注。第一个是 屏幕分辨率适配——不同用户的显示器分辨率和缩放比例不同,Agent 截图中的元素位置可能变化。解决方案是在 POC 阶段测试多种分辨率配置(1920x1080、2560x1440、3840x2160),确认 Agent 在不同分辨率下的表现。第二个是 网络延迟波动——Computer Use 的截图 → 模型推理 → 执行循环对网络延迟敏感。在 POC 阶段需要模拟不同网络条件下的表现,确认延迟增加时的容错能力。第三个是 动态内容处理——网页中的广告、推荐内容、实时通知等动态元素可能干扰 Agent 的视觉理解。解决方案是在 POC 阶段收集这些干扰案例,评估 Agent 的抗干扰能力,并在必要时添加过滤规则。第三阶段:安全与治理建设(2-4 周)。 Computer Use Agent 拥有"操作计算机"的能力,这意味着它拥有与人类操作员相同的权限。安全治理是生产部署的前置条件:凭据管理(使用 Azure Key Vault 或 HashiCorp Vault 存储登录凭据,绝不硬编码)、权限最小化(Agent 运行的账户只授予完成任务所需的最小权限)、审计日志(记录每次截图、决策和操作的完整链路)、人工审批(关键操作前通过 Outlook 或 Teams 请求人工确认)。第四阶段:灰度发布与监控(持续)。 不要一次性全量部署。先用 10% 的流量运行 Agent,逐步扩大到 50%、100%。监控关键指标:任务成功率、平均完成时间、异常率、token 消耗。设置告警阈值——当成功率低于 90% 或 token 消耗异常增长时自动降级。生产环境监控的最佳实践: Computer Use Agent 的生产监控需要比传统软件更细粒度的指标体系。建议监控以下核心指标:截图失败率(反映屏幕采集模块的稳定性)、模型推理延迟 P99(反映基础设施的响应能力)、动作执行失败率(反映输入注入模块的可靠性)、任务完成率(端到端业务指标)、以及 token 消耗趋势(成本指标)。这些指标应该集成到现有的监控平台(如 Grafana、Datadog)中,并设置自动告警规则。
💡 一句话理解
⚠️ 常见踩坑
Computer Use Agent 的权限管理是最大风险点。如果 Agent 以管理员账户运行且没有审批流程,一旦模型出现误操作,可能造成不可逆的数据损失。生产部署前必须完成权限最小化和人工审批两个安全层的建设。
6典型企业应用场景
Computer Use Agent 在多个行业已经找到杀手级应用场景。以下是经过验证的高价值用例。
财务对账自动化: 企业通常需要从多个银行门户、ERP 系统和 Excel 表格中提取数据并完成对账。这些系统的 API 往往不开放或不完整,RPA 脚本又因为银行门户频繁改版而频繁失效。Computer Use Agent 通过视觉理解可以自适应界面变化,将月度对账时间从人工的 3-5 天缩短到数小时。关键挑战:银行安全控件(如 U 盾验证)无法被 Agent 操作,需要在这些节点插入人工确认。客服工单处理: 客服系统通常涉及多个后台系统的操作——查询客户信息、查看历史工单、更新状态、发送通知。Computer Use Agent 可以根据工单内容自动完成标准化的处理流程,只在需要判断或权限不足时转交人工。这种"AI 预处理 + 人工确认"的模式可以将客服处理效率提升 3-5 倍。软件测试自动化: 传统的 UI 测试框架(Selenium、Playwright)需要编写和维护大量的定位器。Computer Use Agent 可以用自然语言描述测试用例("登录系统,创建一个新用户,验证欢迎页面显示正确"),模型自行完成界面操作。这特别适合探索性测试——Agent 可以像真实用户一样自由探索应用,发现测试用例未覆盖的边界情况。数据录入与迁移: 企业系统迁移或整合时,往往需要将数据从一个系统的界面录入到另一个系统。这种"搬运工"类工作人工做极其枯燥且容易出错,RPA 在源系统或目标系统没有 API 时也无能为力。Computer Use Agent 是理想选择——它可以同时操作两个系统,完成数据的读取、校验和录入。
| 场景 | 人工耗时 | CUA 耗时 | 成功率 | ROI 周期 |
|---|---|---|---|---|
财务对账 | 3-5 天/月 | 2-4 小时/月 | 92-96% | 1-2 个月 |
客服工单 | 5-10 分钟/单 | 1-2 分钟/单 | 88-94% | 2-3 个月 |
UI 测试 | 2-4 小时/轮 | 30-60 分钟/轮 | 85-92% | 1 个月 |
数据录入 | 10-20 分钟/条 | 1-3 分钟/条 | 90-95% | 1-2 个月 |
报表生成 | 1-2 小时/份 | 10-20 分钟/份 | 93-97% | 1 个月 |
💡 一句话理解
⚠️ 常见踩坑
不要忽视隐性成本:Agent 误操作导致的数据修复、异常处理的人工介入、安全审计的合规成本。在 ROI 计算中应预留 20% 的风险缓冲。
7安全治理与合规
Computer Use Agent 的安全治理是企业落地的核心挑战。与传统软件不同,Agent 拥有"视觉感知 + 自主决策 + 物理操作"的完整能力链,这意味着传统的安全边界不再适用。凭据安全是第一条防线。 Agent 需要登录各种系统才能完成任务,但这些凭据绝不能硬编码在流程配置中。Microsoft Copilot Studio GA 版本通过 Azure Key Vault 集成解决了这个问题——凭据在运行时动态获取,且受到 Key Vault 的访问策略和审计日志保护。如果自建方案,应使用 HashiCorp Vault 或同等级别的密钥管理系统。操作权限最小化是第二条防线。 Agent 运行的操作系统账户应该只拥有完成指定任务所需的最小权限。例如,一个只需要读取财务数据的 Agent 不应该有删除或修改数据的权限。这可以通过操作系统级别的权限隔离(Linux 用户权限、Windows 服务账户)和应用级别的权限控制(RBAC)来实现。审计与追溯是第三条防线。 每一次 Computer Use 操作都应该被记录:Agent 看到了什么(截图)、决定做什么(决策日志)、实际做了什么(操作记录)。Microsoft Purview 提供了企业级的审计集成,可以将 Agent 操作日志纳入统一的安全信息中心。对于自建方案,需要自行设计日志采集和存储架构。人工审批(Human-in-the-Loop)是最后的安全网。 对于高风险操作——涉及资金转移、数据删除、权限变更——Agent 应该在执行前请求人工确认。Copilot Studio GA 版支持通过 Outlook 发送审批请求,人工批准或拒绝后 Agent 继续或中止流程。这不是可选项,而是生产部署的必须项。
# OmniParser 本地原型开发示例
# 安装依赖
pip install omniparser pillow
# 解析截图
python -c "
from omniparser import OmniParser
parser = OmniParser(model_path='path/to/omniparser-model')
screenshot = capture_screen() # 获取屏幕截图
parsed_elements = parser.parse(screenshot)
# parsed_elements 返回结构化的 UI 元素列表
# 每个元素包含: {type: 'button', text: '提交', bbox: [x1, y1, x2, y2]}
for elem in parsed_elements:
print(f"{elem['type']}: {elem['text']} at {elem['bbox']}")
"💡 一句话理解
合规提示:在金融和医疗行业,Computer Use Agent 的部署需要满足监管审计要求。提前与合规团队沟通,确保审计日志的保存周期、加密标准和访问控制满足行业规范。
⚠️ 常见踩坑
Computer Use Agent 的"视觉能力"本身就是一个安全风险——Agent 截图中可能包含敏感信息(客户数据、内部文档、个人身份信息)。截图的存储和传输必须加密,且访问权限应严格控制。
8未来展望与扩展阅读
Computer Use Agent 仍处于快速演进阶段,未来 12-18 个月预计会出现以下趋势。
多 Agent 协作操作: 当前的 Computer Use Agent 主要是单 Agent 操作单台计算机。未来将出现多个 Agent 协同操作多个系统的场景——一个 Agent 操作 CRM 系统查询客户信息,另一个 Agent 操作 ERP 系统检查库存,第三个 Agent 综合信息生成报价单。这种编排需要更高级的协调机制。更强的异常自愈能力: 当前的 Computer Use Agent 在遇到意外弹窗、网络超时或界面大幅变化时仍会失败。下一代模型将具备更强的异常检测和恢复能力——自动识别问题、尝试替代方案、在无法解决时优雅降级而非崩溃。从"看屏幕"到"理解业务": 目前的 Computer Use Agent 主要解决"如何操作"的问题,但对"为什么要这样操作"的理解有限。未来的 Agent 将结合业务知识图谱,不仅能操作界面,还能理解操作的业务含义,从而做出更智能的决策。标准化协议的出现: 随着 Microsoft、Anthropic、OpenAI 等厂商的 Computer Use 方案成熟,行业可能需要一个标准化的 Computer Use 协议——类似 A2A(Agent-to-Agent)协议之于 Agent 互操作。这将使得不同厂商的 Agent 可以无缝协作。扩展阅读建议: 建议按以下顺序深入学习:首先阅读 Anthropic 的 Computer Use 技术文档,了解底层原理;然后学习 Microsoft Copilot Studio 的官方教程,掌握企业级配置;最后研究 OS-World 基准测试论文,了解学术界的评估方法和未来方向。
💡 一句话理解
关注 Microsoft Power Platform 的每月更新——Copilot Studio 的 Computer Use 能力仍在快速迭代,每月都有新功能发布。同时关注 Anthropic 的 Claude 更新,两个平台的技术正在互相借鉴和融合。
⚠️ 常见踩坑
Computer Use 是一个快速发展的领域,本文描述的技术细节和功能特性可能在几个月后发生变化。建议持续关注官方文档和社区讨论,确保你的知识库和实施方案保持更新。
🎯 相关面试题
巩固本篇知识点,备战 AI 岗位面试。
- 高级系统设计高频查看详解 →
如何设计企业级 AI Token 预算管理与模型路由系统?
按"质量-成本-延迟"三角,用分级预算上限+轻量分类器路由+语义缓存+流式降感知延迟,守住质量底线的同时大幅降本。
- 中级系统设计查看详解 →
AI 对话流的传输选型:WebSocket、SSE、WebRTC 有何区别,分别何时用?
纯文本流式 token 用 SSE 最简单;需要客户端持续上行(打断/语音)用 WebSocket;端到端实时语音音频用 WebRTC。
- 初级概念高频查看详解 →
什么是 LangChain?它要解决什么问题?核心组件有哪些?
LangChain 是 LLM 应用开发的编排框架,把模型、提示、记忆、检索、工具、Agent 等模块粘合成完整应用,2026 以 LCEL 为核心,生态含 LangGraph、LangSmith。
- 中级概念查看详解 →
LangChain 的 LCEL 表达式语言是什么?有什么优势?
LCEL 是 LangChain 的声明式表达式语言,用 | 管道把 Runnable 组合成链,统一 invoke/batch/stream/ainvoke 接口,并内置流式、并行、异步、重试与 fallback、可观测,取代旧的硬编码 Chain。