什么是上下文工程（Context Engineering）？为什么说它是 2026 最重要的 AI 工程技能？

Question 1

Accepted Answer

一句话定义 上下文工程（Context Engineering）指的是：在模型每一次推理之前，系统性地决定、组装并管理送入上下文窗口的全部信息。它把焦点从「如何写好一句 Prompt」抬升到「如何为模型在每一步动态构建最合适的上下文」。 它包含哪些内容 - 系统指令：角色、任务边界、行为准则与安全约束。 - 检索到的知识：通过 RAG 召回并经过排序、去重、压缩后的相关片段。 - 工具与其结果：可用工具的定义，以及上一步工具调用返回的观测结果。 - 记忆：会话短期记忆与跨会话长期记忆（用户偏好、历史结论）。 - 示例与格式约束：Few-shot 范例、输出 Schema（如 JSON）与分隔结构。 与 Prompt 工程的区别 Prompt 工程关注「单条提示词怎么写得清晰」；上下文工程更全局、更动态：它要在有限的 Token 预算下，决定放什么、放多少、怎么排序，并随 Agent 的每一步循环不断重组上下文。可以理解为：Prompt 工程是写好一段话，上下文工程是设计「每一步往窗口里塞什么」的整套机制。 为什么是 2026 最重要的技能 - 能力瓶颈转移：模型推理与指令遵循已足够强，决定上限的不再是模型，而是上下文的相关性与组织方式。 - 直接决定三大指标：上下文相关 → 回答更准；上下文精简 → Token 成本与延迟更低；上下文稳定有序 → 减少幻觉与跑偏，可靠性更高。 - Agent 多步放大效应：Agent 每一步都重建上下文，任何冗余或污染都会在多轮中累积，导致「上下文腐烂」，因此组装策略的价值被成倍放大。

Question 2

上下文工程和 RAG 是什么关系？

Accepted Answer

RAG（检索增强生成）是上下文工程的一个重要子环节，负责「从外部知识库召回相关内容并放进上下文」。上下文工程则是更上层的统筹：除了管 RAG 召回的知识，还要管系统指令、工具结果、记忆、示例与格式，并在 Token 预算内对它们统一做取舍、排序与压缩。可以说 RAG 解决「找到知识」，上下文工程解决「在每一步把哪些知识、以什么形式、连同其它信息一起喂给模型」。

Question 3

在 Token 预算有限时，如何决定上下文的取舍？

Accepted Answer

常见做法：一是按相关性排序，只保留召回得分高的片段，并把最关键内容放在开头或结尾以规避中间遗忘；二是做压缩，对长文档或历史对话做摘要、抽取要点而非全量塞入；三是分层记忆，短期保留近几轮原文、长期只存提炼后的结论；四是工具结果裁剪，只回传对下一步决策有用的字段。核心原则是「相关优先、精简优先」，在准确率、成本与延迟之间取平衡。

Question 4

什么是「上下文腐烂」（Context Rot）？如何缓解？

Accepted Answer

上下文腐烂指在 Agent 多步循环中，上下文里逐渐积累了过时、重复或不相关的信息（如旧的工具输出、失败的尝试），不断污染后续推理，导致质量随步数下降。缓解手段包括：定期对历史做摘要压缩、剔除已失效的中间结果、为不同子任务隔离上下文（子 Agent / 分段处理）、以及把稳定信息外置到记忆或文件而非长期留在窗口里。

什么是上下文工程（Context Engineering）？为什么说它是 2026 最重要的 AI 工程技能？

核心要点

标准回答

常见误区

追问

🔗 相似问题

延伸学习

核心术语