什么是 AI Agent？它与大语言模型（LLM）的本质区别是什么？

Question 1

Accepted Answer

先说 LLM 是什么 大语言模型本质上是一个无状态的概率函数：给它一段文本（Prompt），它预测并输出下一段最可能的文本。它不会主动行动，不记得上一次对话，也无法自己去查资料或执行操作——一次调用就结束了，输入决定输出，仅此而已。 再说 Agent 是什么 AI Agent 把 LLM 当作「大脑」，并在外面包了一整套机制，让它能为一个目标持续工作。一个典型 Agent 会：感知环境拿到当前状态，让 LLM 思考并规划下一步，调用工具（搜索、代码执行、API、数据库）真正去行动，观察行动结果，再据此决定继续、调整还是收尾。这构成一个「观察-思考-行动」的闭环，循环往复直到目标达成或触发终止条件。 本质区别在哪 第一是自主性：LLM 只回答你问的那一句，Agent 自己决定下一步该做什么、用哪个工具。第二是与环境交互：Agent 通过工具读写外部世界，通过记忆保存上下文和历史，LLM 本身两者都没有。第三是闭环迭代：Agent 能根据行动反馈纠错和重试，LLM 是一次性的。第四是有状态且目标导向：Agent 围绕一个目标维持状态推进多步，LLM 无状态、无目标。 一句话总结 LLM 是「会说话的引擎」，Agent 是「装上了眼睛、手脚、记忆和方向盘的车」。可以用一个公式记：Agent = LLM + 规划 + 记忆 + 工具 + 循环。

Question 2

一个只调用一次工具就返回的系统，算 Agent 吗？

Accepted Answer

严格说更接近「工具增强的 LLM 调用」或 Workflow，而非完整 Agent。区别在于是否由模型自主决定流程、是否存在「观察-思考-行动」的多步闭环。单次固定调用没有迭代与自主决策，缺少 Agent 最核心的循环与状态。

Question 3

Agent 一定要用最强的大模型做大脑吗？

Accepted Answer

不一定。大脑的推理与规划能力确实影响上限，复杂任务通常需要较强模型。但实践中常用分级策略：用小模型做路由、判断、简单子任务，只在关键的规划与合成环节用大模型，以平衡效果、延迟和成本。

Question 4

让 LLM 具备自主性会带来什么新风险？

Accepted Answer

自主决策意味着不可控性上升：可能调用错误工具、陷入无效循环、放大早期错误，还可能产生数据泄露或越权操作等安全问题。因此需要循环轮数上限、工具权限控制、人类确认（human-in-the-loop）和可观测性追踪来兜底。

什么是 AI Agent？它与大语言模型（LLM）的本质区别是什么？

核心要点

标准回答

常见误区

追问

🔗 相似问题

延伸学习

核心术语