上下文压缩(Context Compaction)

对话太长就自动压缩历史

亦作、亦称:Context Compaction · Memory Compaction · Context Compression · 上下文摘要

概述

Agent 在对话超过上下文窗口限制时,使用小型模型将历史对话压缩为摘要,释放上下文空间以继续处理新信息的机制。2026 年 Claude Code 源码泄露揭示了其内部实现:当对话长度超过阈值时,自动触发 Memory Compaction,用轻量模型生成历史摘要。

工作原理

Agent 在对话超过上下文窗口限制时,使用小型模型将历史对话压缩为摘要,释放上下文空间以继续处理新信息的机制。2026 年 Claude Code 源码泄露揭示了其内部实现:当对话长度超过阈值时,自动触发 Memory Compaction,用轻量模型生成历史摘要。

应用场景

上下文压缩常见于:AI 研究与产业落地。实际选型需结合业务指标、数据规模与部署约束评估适用性。

局限与误区

围绕 上下文压缩 的口语化说法(见「常见误解」)常过度简化。效果依赖数据质量、任务匹配与系统整体设计;生产环境应配合评测、监控与人工复核。

背景与发展

上下文压缩随 AI 研究与工程实践持续演进,定义边界与最佳实践仍在更新。建议结合原始论文、官方文档与本站延伸阅读建立准确认知。

常见误解

日常交流中容易听到的简化说法,未必准确,但能帮助理解误解从何而来。

  • 「对话太长就自动压缩历史」
  • 「Agent 的记忆压缩机制」

相关术语

和本术语关联紧密的其他词条,便于串联理解。