核心要点
能说清各框架定位:AutoGPT(早期自主探索、演示性强但不稳)、CrewAI(角色+任务组织多 Agent、上手简单)、LangGraph(图/状态机编排、支持循环分支与人在环、可控生产级)、AutoGen(微软,多 Agent 对话式协作)、LlamaIndex(偏 RAG 数据接入)
能区分单 Agent 与多 Agent 场景:简单任务单 Agent 足矣,复杂分工才上多 Agent,别为多而多
能讲选型维度:可控性/可观测、生态与社区、学习成本、是否生产级、与现有技术栈契合度
给的是判断框架而非吹某一个:先看任务形态再匹配框架,没有银弹
标准回答
先给各框架的定位画像
主流框架的设计哲学差异很大。AutoGPT 是早期的自主 Agent 代表,强调「给个目标就自己规划执行」,演示效果惊艳但实际运行不稳、易跑偏,更适合理解理念而非直接上生产。CrewAI 以「角色(Role)+ 任务(Task)」的隐喻来组织多个 Agent 协作,抽象直观、上手快,适合快速搭建有明确分工的多 Agent 流程。LangGraph 把 Agent 流程建模为图 / 状态机,节点是步骤、边是转移,原生支持循环、条件分支与人在环(human-in-the-loop),可控性和可观测性强,偏向生产级复杂编排。AutoGen 来自微软,主打多 Agent 对话式协作,让多个 Agent 互相发消息讨论来解决问题,研究与复杂协作场景下灵活。LlamaIndex 则更偏 RAG / 数据接入,强项是把外部数据喂给 LLM,也提供了 Agent 能力但重心在检索。
再讲选型维度
选型不该问「哪个最好」,而该问「我的任务长什么样」。关键维度有五个:一是单 Agent 还是多 Agent——简单线性任务一个 Agent 加几个工具就够,别为了多 Agent 而引入协调开销;二是可控性与可观测性——生产系统要能精确控制流程、能 trace、能在关键节点插入人工审核,这正是 LangGraph 这类状态机编排的强项;三是生态与社区——集成的工具、模型、向量库是否齐全,文档与社区是否活跃,决定踩坑成本;四是学习成本——CrewAI 的角色抽象上手快,LangGraph 的图模型更强大但概念更重;五是是否生产级——演示原型可以用轻量框架,长期维护的线上系统要选稳定、可调试、可控的方案。
给出落地的判断顺序
实践中我会这样选:先判断任务复杂度——简单就单 Agent,甚至不一定要重框架;需要明确角色分工、协作直观,CrewAI 起步快;流程有复杂的循环、分支、状态与人工介入、要上生产,优先 LangGraph;偏研究性的多 Agent 对话探索,AutoGen 灵活;如果核心痛点是「把大量私有数据接进来做问答」,那本质是 RAG,LlamaIndex 更对口。最后还要看与现有技术栈(语言、可观测平台、部署环境)的契合度。框架是工具不是信仰,按场景匹配即可。
常见误区
⚠️ 常见踩坑
最大的误区是把框架当信仰、不分场景一律上多 Agent——简单任务硬拆成多个 Agent 互相对话,徒增协调开销、延迟和不确定性,还更难调试。另一个误区是只看「Demo 多炫」而忽略生产要素:可观测性、可控的终止与人工介入、稳定性才是线上系统的命门,AutoGPT 类自主探索框架在演示之外往往难以稳定落地。还有人误以为框架能替代工程能力——其实再好的框架也要靠清晰的任务拆解、可靠的工具设计和评测体系兜底。正确姿势是按任务形态与生产需求选型,而非追新或迷信单一框架。
追问
追问 1:什么情况下其实不需要任何 Agent 框架,自己手写编排反而更好?
当流程是确定的、步骤有限且分支简单时,手写一个「LLM 调用 + 工具调用 + 几个 if/else」的编排往往更清晰、更可控、依赖更少。框架的价值在于复杂状态管理、循环分支、多 Agent 协调、可观测与人在环这些「重活」;如果你的场景用不到这些,引入框架反而带来版本升级、抽象黑盒、调试困难等成本。判断标准是:流程是否复杂到手写会失控。简单场景从轻到重逐步演进,需要时再引框架,比一上来就套重框架更稳。
追问 2:LangGraph 用「图/状态机」建模相比 CrewAI 的「角色协作」抽象,本质区别是什么?
区别在于「控制流的显式程度」。LangGraph 把每个步骤建为节点、转移建为边,循环、条件分支、状态在哪里流转都是显式声明的,因此流程精确可控、可断点、可恢复、便于 trace,适合需要严格控制的生产编排。CrewAI 的角色+任务抽象更高层、更接近自然语言直觉,开发者描述「谁负责什么」,协调细节由框架隐式处理,上手快但对流程的精细控制弱一些。一个偏「我精确编排每一步」,一个偏「我声明分工让框架去协调」,选哪个取决于你更需要可控性还是开发速度。
追问 3:多 Agent 协作相比单 Agent 多工具,真正的收益和代价分别是什么?
🔗 相似问题
同一考点的不同问法,面试官可能换着问,一起刷更稳
没找到想看的面试题?把你想看的告诉我们 →
延伸学习
按主题分类的相关资源,便于系统复习