AI Agent 的基本架构由哪些核心组件构成？

Question 1

Accepted Answer

整体框架 一个 AI Agent 以 LLM 为大脑，外围通常由四类核心组件构成：规划、记忆、工具、以及画像/控制循环。它们围绕大脑协同，把「想」和「做」串成一个持续推进的闭环。 规划（Planning） 负责「想清楚怎么做」。它把一个大目标拆解成有序的子任务，决定每一步该采取什么动作。常见范式有思维链（让模型逐步推理）、ReAct（推理与行动交替）、计划-执行（先列计划再逐项执行），以及反思（Reflection，对结果做自我评估并修正）。规划质量直接决定 Agent 能否处理复杂多步任务。 记忆（Memory） 负责「记住该记的」。短期记忆就是当前对话/任务塞进上下文窗口的内容，受限于窗口长度；长期记忆通常借助向量数据库，把历史交互、知识、经验向量化存储，需要时检索回来。记忆让 Agent 能跨多步甚至跨会话保持连贯，而不至于「转头就忘」。 工具（Tools / Action） 负责「真正去做」。这是 LLM 与外部世界交互的接口：网页搜索、代码执行、调用 API、查询数据库等。落地方式包括函数调用（Function Calling）、MCP（统一的工具/数据连接协议）、以及检索。没有工具，模型只能空谈；有了工具，它才能感知最新信息并改变外部状态。 画像与控制循环（Profile + Orchestrator） 画像定义 Agent 的角色、目标与行为约束（比如「你是严谨的数据分析助手」），影响它如何规划与措辞。控制循环（编排器）则是把四件套驱动起来的引擎：感知当前状态到让 LLM 思考规划到调用工具行动到观察结果，再回到下一轮，直到达成目标或触发终止条件。 如何协同成闭环 控制循环每一轮先观察（读环境与记忆），再思考（规划下一步），然后行动（调工具），把结果写回记忆，进入下一轮。这就是「观察-思考-行动」闭环，四个组件各司其职又彼此咬合，缺一不可。

Question 2

短期记忆和长期记忆分别怎么实现，各解决什么问题？

Accepted Answer

短期记忆通常就是放进当前上下文窗口的对话历史与中间结果，解决「本轮任务内的连贯」，但受窗口长度限制。长期记忆一般把历史与知识写入向量数据库，用 embedding 检索按需召回，解决「跨任务、跨会话的记忆」和上下文装不下的问题，二者常配合使用。

Question 3

规划组件里 ReAct 和反思（Reflection）有什么区别？

Accepted Answer

ReAct 是在执行过程中让「推理」和「行动」交替进行——想一步、做一步、看结果再想下一步，强调边做边调整。反思则是在一段执行之后回头评估结果好坏、找出错误并生成改进方案，强调事后纠错。前者管「过程中怎么走」，后者管「走错了怎么补」，常组合使用。

Question 4

MCP 和传统 Function Calling 在工具层有什么差异？

Accepted Answer

Function Calling 是把工具以函数 schema 直接喂给单个模型应用，工具与应用强耦合、各自实现。MCP（Model Context Protocol）是一套标准化协议，把工具和数据源做成可复用的 Server，任何兼容的 Agent 都能即插即用，降低重复对接成本、提升工具生态的互操作性。

AI Agent 的基本架构由哪些核心组件构成？

核心要点

标准回答

常见误区

追问

🔗 相似问题

延伸学习

核心术语