核心要点

  • 能给定义:AI Agent 是以 LLM 为「大脑」,能感知环境、自主规划、调用工具、执行多步动作并根据反馈迭代以达成目标的系统

  • 能点破 LLM 本质:LLM 只是「输入一段文本到输出一段文本」的无状态函数,本身不行动、不记忆、不闭环

  • 能说清四点本质区别:自主性(自己决定下一步)、与环境交互(工具/记忆)、闭环(观察-思考-行动循环)、有状态且目标导向

  • 能给出公式记忆:Agent = LLM + 规划 + 记忆 + 工具 + 循环

标准回答

先说 LLM 是什么

语言模型本质上是一个无状态的概率函数:给它一段文本(Prompt),它预测并输出下一段最可能的文本。它不会主动行动,不记得上一次对话,也无法自己去查资料或执行操作——一次调用就结束了,输入决定输出,仅此而已。

再说 Agent 是什么

AI Agent 把 LLM 当作「大脑」,并在外面包了一整套机制,让它能为一个目标持续工作。一个典型 Agent 会:感知环境拿到当前状态,让 LLM 思考并规划下一步,调用工具(搜索、代码执行、API、数据库)真正去行动,观察行动结果,再据此决定继续、调整还是收尾。这构成一个「观察-思考-行动」的闭环,循环往复直到目标达成或触发终止条件。

本质区别在哪

第一是自主性:LLM 只回答你问的那一句,Agent 自己决定下一步该做什么、用哪个工具。第二是与环境交互:Agent 通过工具读写外部世界,通过记忆保存上下文和历史,LLM 本身两者都没有。第三是闭环迭代:Agent 能根据行动反馈纠错和重试,LLM 是一次性的。第四是有状态且目标导向:Agent 围绕一个目标维持状态推进多步,LLM 无状态、无目标。

一句话总结

LLM 是「会说话的引擎」,Agent 是「装上了眼睛、手脚、记忆和方向盘的车」。可以用一个公式记:Agent = LLM + 规划 + 记忆 + 工具 + 循环。

常见误区

⚠️ 常见踩坑

别把「会调一次函数 / 接了联网搜索的聊天机器人」就当成 Agent。关键不在于能不能调工具,而在于是否由模型自主决策、能否多步闭环迭代并维持状态去达成目标——只回答一轮、流程写死的不算真正的 Agent。

追问

追问 1一个只调用一次工具就返回的系统,算 Agent 吗?

严格说更接近「工具增强的 LLM 调用」或 Workflow,而非完整 Agent。区别在于是否由模型自主决定流程、是否存在「观察-思考-行动」的多步闭环。单次固定调用没有迭代与自主决策,缺少 Agent 最核心的循环与状态。

追问 2Agent 一定要用最强的大模型做大脑吗?

不一定。大脑的推理与规划能力确实影响上限,复杂任务通常需要较强模型。但实践中常用分级策略:用小模型做路由、判断、简单子任务,只在关键的规划与合成环节用大模型,以平衡效果、延迟和成本。

追问 3让 LLM 具备自主性会带来什么新风险?

自主决策意味着不可控性上升:可能调用错误工具、陷入无效循环、放大早期错误,还可能产生数据泄露或越权操作等安全问题。因此需要循环轮数上限、工具权限控制、人类确认(human-in-the-loop)和可观测性追踪来兜底。

🔗 相似问题

同一考点的不同问法,面试官可能换着问,一起刷更稳

没找到想看的面试题?把你想看的告诉我们 →

延伸学习

按主题分类的相关资源,便于系统复习