核心要点

  • 能讲清至少 2-3 种协作拓扑并举框架:层级式 Supervisor-Worker(CrewAIMetaGPT)、辩论式(互相批评迭代收敛)、流水线串行、对等网络(AutoGen GroupChat)

  • 能说出共性工程要点:清晰的角色 system prompt、结构化消息协议、共享黑板/状态存储

  • 能说出失败与成本控制:超时重试、最大轮数限制,防止 Agent 之间无限对话烧 token

  • 能判断何时该用多 Agent:角色分工明确、可并行或需专长/辩论才用,简单任务单 Agent 更省成本

简要回答

Manager 分派子任务给 Worker;Debate 多 Agent 讨论达成共识;Pipeline 按阶段传递;关键在角色定义、消息协议和共享状态设计。

标准回答

常见协作拓扑有四种。

层级式(Supervisor-Worker)

Supervisor 拆任务、派发给专家 Agent、汇总结果,如 MetaGPT、CrewAI

辩论式

多 Agent 各自提方案、互相批评,迭代收敛到更可靠的答案。

流水线

按阶段串行传递,如检索 Agent → 分析 Agent → 写作 Agent。

对等网络

Agent 通过消息总线自由通信,如 AutoGen GroupChat。

工程要点

  1. 明确每个角色的 system prompt 与职责边界。
  2. 用结构化消息格式通信,便于解析与路由。
  3. 共享黑板/状态存储同步中间结果。
  4. 设超时与重试,限制最大对话轮数。
  5. 控制成本,避免 Agent 之间无限对话。

常见误区

⚠️ 常见踩坑

默认「多 Agent 一定优于单 Agent」——拆得越多通信开销、协调失败和 token 成本越高,简单任务单 Agent 反而更稳更省;另一误区是不设最大轮数与共享状态,导致 Agent 之间反复对话发散、状态不一致。

追问

追问 1多 Agent 一定比单 Agent 好吗?

不一定。简单任务单 Agent 更省 token、延迟与调试成本。多 Agent 适合角色分工明确、可并行、需辩论/专长的复杂流程;否则会增加通信开销与协调失败风险。

追问 2A2A 协议的作用?

Agent-to-Agent 协议标准化不同厂商/框架 Agent 之间的发现、认证与消息格式,便于跨系统协作(如一个 Supervisor 调用外部专家 Agent),类似 MCP 对工具的标准化,但面向 Agent 对等通信。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。

🛠️ AI 工具

  • LangChain

    最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施

  • MCP Playwright

    Playwright 浏览器自动化的 MCP 实现,将成熟的 Playwright 测试框架能力通过标准 MCP 协议暴露给 AI Agent。支持网页抓取、表单自动化、E2E 测试场景、SPA 应用交互等完整浏览器自动化能力。5,400+ GitHub Star,相比原生浏览器 MCP 方案,Playwright 的跨浏览器支持(Chromium/Firefox/WebKit)和成熟 API 使其在复杂场景下更可靠

  • AutoGen / AG2

    微软开源对话式多 Agent 框架,54,000+ GitHub stars(最高),强项是代码沙箱和迭代调试,多个 Agent 通过对话协作完成复杂编程任务,MIT 协议

  • crewAI

    角色扮演 AI Agent 编排框架,49,411+ stars。通过角色分配让多个 Agent 协作完成复杂任务,支持工具调用、任务委派、结果审核。是构建 Multi-Agent 系统的最流行框架。

  • MetaGPT

    多 Agent 软件开发框架,67,270+ stars。首个 AI 软件公司概念——将产品经理、架构师、工程师、QA 等角色赋予不同 Agent,协作完成从需求到代码的全流程,是 AI 自主软件开发的标杆项目