标准回答
先说 LLM 是什么
大语言模型本质上是一个无状态的概率函数:给它一段文本(Prompt),它预测并输出下一段最可能的文本。它不会主动行动,不记得上一次对话,也无法自己去查资料或执行操作——一次调用就结束了,输入决定输出,仅此而已。
再说 Agent 是什么
AI Agent 把 LLM 当作「大脑」,并在外面包了一整套机制,让它能为一个目标持续工作。一个典型 Agent 会:感知环境拿到当前状态,让 LLM 思考并规划下一步,调用工具(搜索、代码执行、API、数据库)真正去行动,观察行动结果,再据此决定继续、调整还是收尾。这构成一个「观察-思考-行动」的闭环,循环往复直到目标达成或触发终止条件。
本质区别在哪
第一是自主性:LLM 只回答你问的那一句,Agent 自己决定下一步该做什么、用哪个工具。第二是与环境交互:Agent 通过工具读写外部世界,通过记忆保存上下文和历史,LLM 本身两者都没有。第三是闭环迭代:Agent 能根据行动反馈纠错和重试,LLM 是一次性的。第四是有状态且目标导向:Agent 围绕一个目标维持状态推进多步,LLM 无状态、无目标。
一句话总结
LLM 是「会说话的引擎」,Agent 是「装上了眼睛、手脚、记忆和方向盘的车」。可以用一个公式记:Agent = LLM + 规划 + 记忆 + 工具 + 循环。
常见误区
⚠️ 常见踩坑
别把「会调一次函数 / 接了联网搜索的聊天机器人」就当成 Agent。关键不在于能不能调工具,而在于是否由模型自主决策、能否多步闭环迭代并维持状态去达成目标——只回答一轮、流程写死的不算真正的 Agent。
追问
追问 1:一个只调用一次工具就返回的系统,算 Agent 吗?
严格说更接近「工具增强的 LLM 调用」或 Workflow,而非完整 Agent。区别在于是否由模型自主决定流程、是否存在「观察-思考-行动」的多步闭环。单次固定调用没有迭代与自主决策,缺少 Agent 最核心的循环与状态。
追问 2:Agent 一定要用最强的大模型做大脑吗?
追问 3:让 LLM 具备自主性会带来什么新风险?
自主决策意味着不可控性上升:可能调用错误工具、陷入无效循环、放大早期错误,还可能产生数据泄露或越权操作等安全问题。因此需要循环轮数上限、工具权限控制、人类确认(human-in-the-loop)和可观测性追踪来兜底。
🔗 相似问题
同一考点的不同问法,面试官可能换着问,一起刷更稳
没找到想看的面试题?把你想看的告诉我们 →
延伸学习
按主题分类的相关资源,便于系统复习