核心要点
能按「计划与执行是否解耦」串起方法:Zero-shot 列步骤 → Plan-and-Execute 先规划后执行 → ReWOO 规划与工具调用分离省往返 → ToT 树搜索多路径择优
能对比 Plan-and-Execute 与 ReAct:前者先出完整计划适合步骤清晰可并行,后者边想边做适合信息逐步暴露需动态调整
能点出动态重规划的必要性:工具失败、Observation 与预期不符时要让 Planner 修订计划,而非死执行原计划
能说出工程约束:长 horizon 误差累积,生产常限制最大步数并加人工 checkpoint
简要回答
先让模型输出完整计划再逐步执行(Plan-and-Execute);或边做边调整(ReAct);复杂任务可用树搜索探索多方案(ToT)。
标准回答
规划方法可按「计划与执行是否解耦」来串。
Zero-shot Planning
prompt 直接要求模型先列步骤再执行,最简单但不够稳健。
Plan-and-Execute
Planner 先生成完整步骤列表,Executor 逐步调用工具,Planner 再根据执行结果修订计划,规划与执行解耦。
ReWOO
把规划与工具调用进一步分离,一次性规划好工具调用再统一执行,减少 LLM 往返、省 token。
Tree of Thoughts(ToT)
对复杂任务做多路径探索 + 评估,回溯择优,适合需要试错的搜索类问题。
挑战与约束
计划漂移、工具失败需动态重规划、长 horizon 误差累积。生产环境常限制最大步数并设人工 checkpoint。
常见误区
⚠️ 常见踩坑
把规划当成「一次性生成、机械执行」——真实环境工具会失败、信息会变,缺少动态重规划会让计划漂移、错误累积;另一误区是无脑追求 ToT 等重型搜索,多数任务用 Plan-and-Execute 即可,盲目树搜索会让 token 和延迟爆炸。
追问
追问 1:Plan-and-Execute vs ReAct?
题库专题:什么是 ReAct 模式?它如何解决 Agent 的推理与行动问题?Plan-and-Execute 先出完整计划再逐步执行,适合步骤清晰、可并行的任务;ReAct 边想边做,适合信息逐步暴露、需根据 Observation 调整的场景。前者计划易过时,后者更灵活但 token 多。
题库延伸:与本追问相关的专题题 → 什么是 ReAct 模式?它如何解决 Agent 的推理与行动问题?
追问 2:如何评估规划质量?
分解是否覆盖目标、步骤可执行性、依赖顺序是否正确;仿真环境成功率;人工 rubric;对比 gold plan 的编辑距离;线上看子任务失败率与重规划次数。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
📖 术语表
📰 AI 资讯
🛠️ AI 工具
- LangChain
最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施
- MCP Playwright
Playwright 浏览器自动化的 MCP 实现,将成熟的 Playwright 测试框架能力通过标准 MCP 协议暴露给 AI Agent。支持网页抓取、表单自动化、E2E 测试场景、SPA 应用交互等完整浏览器自动化能力。5,400+ GitHub Star,相比原生浏览器 MCP 方案,Playwright 的跨浏览器支持(Chromium/Firefox/WebKit)和成熟 API 使其在复杂场景下更可靠
- AutoGen / AG2
微软开源对话式多 Agent 框架,54,000+ GitHub stars(最高),强项是代码沙箱和迭代调试,多个 Agent 通过对话协作完成复杂编程任务,MIT 协议
- crewAI
角色扮演 AI Agent 编排框架,49,411+ stars。通过角色分配让多个 Agent 协作完成复杂任务,支持工具调用、任务委派、结果审核。是构建 Multi-Agent 系统的最流行框架。