核心要点

  • 上下文分层策略

  • 工具调用结果管理

  • 子任务上下文隔离与合并

  • 记忆压缩与遗忘机制

简要回答

百万 Token 上下文时代,Agent 如何组织上下文以支持工具调用和子任务拆解?

标准回答

核心架构分三层:1) 系统层(不变的系统 prompt + 工具定义,约 5-10 万 Token);2) 任务层(当前任务的上下文,包含子任务状态、工具调用结果,约 20-50 万 Token);3) 记忆层(按需检索的长期知识)。工具调用结果应压缩后存入任务层,避免原始输出占满上下文。子任务拆解时,每个子任务有独立上下文窗口,完成后将摘要合并回父任务上下文。关键设计原则:上下文是稀缺资源,需要主动管理而非被动填充。

常见误区

⚠️ 常见踩坑

只背概念不会举例;混淆相似术语;忽略工程落地约束。

追问

追问 1工具调用结果如何压缩?不同类型的工具输出压缩策略有何差异?

结构化输出(JSON/API 响应)提取关键字段丢弃冗余;代码执行结果只保留 stdout 最后 N 行 + 错误信息;文件读取结果做摘要而非全文。压缩率目标:原始输出的 10-30%。关键:压缩时保留"可用于后续推理"的信息,丢弃"仅用于展示"的信息。

追问 2子任务上下文隔离后,如何避免信息丢失导致子任务间冲突?

每个子任务完成后生成"任务摘要"(包含:目标、关键发现、未解决问题、对父任务的建议)。父任务合并摘要时做冲突检测——如果两个子任务的结论矛盾,触发"冲突解决"流程(通常是让 LLM 基于原始证据判断)。关键:摘要不是简单压缩,而是"面向父任务决策"的信息提取。

🔗 相似问题

同一考点的不同问法,换着练更稳

没找到想看的面试题?把你想看的告诉我们 →

延伸学习

按主题分类的相关资源,便于系统复习