标准回答
整体框架
一个 AI Agent 以 LLM 为大脑,外围通常由四类核心组件构成:规划、记忆、工具、以及画像/控制循环。它们围绕大脑协同,把「想」和「做」串成一个持续推进的闭环。
规划(Planning)
负责「想清楚怎么做」。它把一个大目标拆解成有序的子任务,决定每一步该采取什么动作。常见范式有思维链(让模型逐步推理)、ReAct(推理与行动交替)、计划-执行(先列计划再逐项执行),以及反思(Reflection,对结果做自我评估并修正)。规划质量直接决定 Agent 能否处理复杂多步任务。
记忆(Memory)
负责「记住该记的」。短期记忆就是当前对话/任务塞进上下文窗口的内容,受限于窗口长度;长期记忆通常借助向量数据库,把历史交互、知识、经验向量化存储,需要时检索回来。记忆让 Agent 能跨多步甚至跨会话保持连贯,而不至于「转头就忘」。
工具(Tools / Action)
负责「真正去做」。这是 LLM 与外部世界交互的接口:网页搜索、代码执行、调用 API、查询数据库等。落地方式包括函数调用(Function Calling)、MCP(统一的工具/数据连接协议)、以及检索。没有工具,模型只能空谈;有了工具,它才能感知最新信息并改变外部状态。
画像与控制循环(Profile + Orchestrator)
画像定义 Agent 的角色、目标与行为约束(比如「你是严谨的数据分析助手」),影响它如何规划与措辞。控制循环(编排器)则是把四件套驱动起来的引擎:感知当前状态到让 LLM 思考规划到调用工具行动到观察结果,再回到下一轮,直到达成目标或触发终止条件。
如何协同成闭环
控制循环每一轮先观察(读环境与记忆),再思考(规划下一步),然后行动(调工具),把结果写回记忆,进入下一轮。这就是「观察-思考-行动」闭环,四个组件各司其职又彼此咬合,缺一不可。
常见误区
⚠️ 常见踩坑
别把工具调用当成 Agent 的全部。只接函数调用、没有规划与记忆、不构成多轮闭环的,只是「会调工具的 LLM」。真正的 Agent 是四大组件在控制循环里协同,缺了规划或记忆,复杂任务很快就会失控或断片。
追问
追问 1:短期记忆和长期记忆分别怎么实现,各解决什么问题?
短期记忆通常就是放进当前上下文窗口的对话历史与中间结果,解决「本轮任务内的连贯」,但受窗口长度限制。长期记忆一般把历史与知识写入向量数据库,用 embedding 检索按需召回,解决「跨任务、跨会话的记忆」和上下文装不下的问题,二者常配合使用。
追问 2:规划组件里 ReAct 和反思(Reflection)有什么区别?
ReAct 是在执行过程中让「推理」和「行动」交替进行——想一步、做一步、看结果再想下一步,强调边做边调整。反思则是在一段执行之后回头评估结果好坏、找出错误并生成改进方案,强调事后纠错。前者管「过程中怎么走」,后者管「走错了怎么补」,常组合使用。
追问 3:MCP 和传统 Function Calling 在工具层有什么差异?
Function Calling 是把工具以函数 schema 直接喂给单个模型应用,工具与应用强耦合、各自实现。MCP(Model Context Protocol)是一套标准化协议,把工具和数据源做成可复用的 Server,任何兼容的 Agent 都能即插即用,降低重复对接成本、提升工具生态的互操作性。
🔗 相似问题
同一考点的不同问法,面试官可能换着问,一起刷更稳
没找到想看的面试题?把你想看的告诉我们 →
延伸学习
按主题分类的相关资源,便于系统复习