Long-Term Memory（长期记忆）

就是让 AI 跨对话记住你——不只是这次聊天，而是下次打开还记得你喜欢什么

亦作、亦称：长期记忆 · external memory · persistent memory · 长期存储 · 持久化记忆

长期记忆（Long-Term Memory）是 AI Agent 突破上下文窗口限制、实现跨会话持续学习与个性化的核心能力。它通过向量数据库、知识图谱等外部存储，让 Agent 能在数天乃至数月后依然记住用户偏好、历史决策和领域知识。

概述

长期记忆赋予 AI Agent「记住过去、指导未来」的能力，是构建真正有状态 Agent 的基础设施。

定义边界：区别于上下文窗口（In-Context Memory），长期记忆跨越单次会话，数据持久化存储于外部介质
认知科学类比：借鉴人类记忆分类——语义记忆（事实）、情节记忆（经历）、程序性记忆（技能）
核心价值：实现个性化（记住用户偏好）、连续学习（积累任务经验）和知识增强（注入领域知识）
典型规模：可存储数百万条记忆条目，通过向量检索在毫秒级找到相关记忆
代表框架：MemGPT、Mem0、A-MEM、Zep、Letta 等均以长期记忆为核心卖点

工作原理

长期记忆系统通常遵循「写入—存储—检索—注入」四步流程。

写入（Memory Write）：对话结束或触发条件满足时，Agent 将关键信息提取并结构化（可由 LLM 摘要）
存储（Storage）：将文本嵌入为向量后存入向量数据库，或以三元组形式写入知识图谱
检索（Retrieval）：新对话开始时，依据当前输入做语义相似度检索（ANN 近邻搜索），筛选 Top-K 相关记忆
注入（Injection）：将检索到的记忆片段拼入 Prompt，作为 Agent 的「背景知识」参与生成
更新与遗忘：新信息可覆盖旧记忆，或通过时间衰减权重模拟遗忘曲线（Ebbinghaus 遗忘曲线）

类型与实现方式

长期记忆可按存储内容和技术形态两个维度分类。

语义记忆（Semantic Memory）：存储「世界知识」和用户事实，常用 RAG + 向量数据库实现
情节记忆（Episodic Memory）：记录具体对话片段和任务轨迹，按时间顺序存储并支持回溯
程序性记忆（Procedural Memory）：保存操作策略和工具调用规则，常表现为 Few-Shot 示例或工作流模板
图谱记忆（Graph Memory）：以知识图谱存储实体关系，支持多跳推理（AriGraph、Zep）
分层记忆（Hierarchical Memory）：MemGPT 将上下文窗口类比操作系统的内存，将外部数据库类比磁盘，动态换入换出

应用场景

长期记忆在多种 AI 产品和 Agent 系统中已有落地应用。

个人助理 Agent：记忆用户习惯、偏好与日程，实现「越用越懂你」的个性化体验（如 ChatGPT Memory、Claude Projects）
客服与销售 Agent：跨会话保留客户历史订单、投诉记录，避免用户重复提供背景
编程助手：记忆项目架构、代码约定和团队规范，生成风格一致的代码
教育辅导 Agent：追踪学生学习进度和薄弱知识点，制定个性化学习计划
企业知识库 RAG：将公司文档、FAQ 作为长期记忆，支持员工即时查询（对应 agent-005、agent-032）
多 Agent 协作：共享长期记忆池作为团队「共同记忆」，减少跨 Agent 信息孤岛

局限与误区

长期记忆并非越多越好，在实际工程中存在若干挑战。

检索噪声：相关性阈值设置不当会导致无关记忆注入 Prompt，降低生成质量
记忆冲突：同一事实的不同版本共存时，Agent 可能产生矛盾输出，需记忆去重与一致性维护
隐私风险：用户敏感信息持久化存储，面临数据泄露风险，需遵守 GDPR 等法规并做权限隔离
时效性问题：历史记忆可能过时（如用户地址变更），需引入时间戳和衰减机制
误区：长 context ≠ 长期记忆：即使 context window 扩展到 1M token，跨会话持久化仍需外部存储架构
成本与延迟：向量检索和存储引入额外延迟与费用，高并发场景需精细化架构设计

发展脉络

AI 长期记忆研究随 LLM Agent 的兴起而快速演进。

2017 年：Transformer 架构兴起，注意力机制替代 RNN 的隐状态，但仍受 context 窗口限制
2020 年：RAG（Retrieval-Augmented Generation）提出（Lewis et al.），为 LLM 引入外部知识检索范式
2022 年：Generative Agents（Stanford）将 LLM Agent 嵌入模拟环境，首次系统引入记忆流（Memory Stream）架构，含写入、反思、检索三阶段
2023 年：MemGPT（Packer et al.）提出分层记忆，将 LLM 类比为操作系统管理内存与磁盘，推动长期记忆工程化
2023 年：MemoryBank 引入 Ebbinghaus 遗忘曲线，为记忆引入时间衰减权重
2024 年：A-MEM、AriGraph 等图结构记忆方案涌现；Mem0 开源并面向生产部署
2025 年：长期记忆成为主流 AI 助手（ChatGPT、Claude Projects、Gemini）的标配功能，相关 Benchmark（CloneMem、EMemBench）随之建立

常见误解

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

「就是让 AI 跨对话记住你——不只是这次聊天，而是下次打开还记得你喜欢什么」
「短期记忆就是上下文窗口，长期记忆就是外挂的数据库」
「误区：长期记忆不等于更长的 context，关键在于跨会话持久化与主动检索」

延伸阅读

从知识库精选 3 篇文章，帮助深入理解该术语。

外部参考

维基百科：查看「Long-Term Memory」词条

本页内容为本站原创撰写；维基百科链接仅作延伸参考。

Long-Term Memory（长期记忆）

概述

工作原理

类型与实现方式

应用场景

局限与误区

发展脉络

常见误解

相关术语

延伸阅读

Agent 记忆系统（一）：向量数据库与知识图谱

Agent 记忆系统（四）：向量数据库、知识图谱与记忆检索全景指南

AI Agent 记忆层全景：从 mem0 到多模态记忆的完整架构

外部参考

概述

工作原理

类型与实现方式

应用场景

与相邻概念的区别

局限与误区

发展脉络

常见误解

相关术语

延伸阅读

Agent 记忆系统（一）：向量数据库与知识图谱

Agent 记忆系统（四）：向量数据库、知识图谱与记忆检索全景指南

AI Agent 记忆层全景：从 mem0 到多模态记忆的完整架构

外部参考