文章摘要
2026 年 6 月 18 日,Perplexity 发布 Brain——一个为 Agentic AI 设计的自改进记忆系统。与 ChatGPT Memory 记住用户偏好不同,Brain 记住的是 Agent 自己犯过的错误。它构建「活上下文图谱」,夜间自动综合更新,使任务正确率提升 25%、召回率提升 16%、成本降低 13%。本文从架构设计、记忆合成机制、与竞品对比、到对 Agentic AI 的深远影响,全面解析这一范式转变。
一、从「记住你」到「记住错误」——AI 记忆的范式转变
2026 年 6 月 18 日,Perplexity 发布了 Brain——一个嵌入其 Computer Agent 产品的自改进记忆系统。Perplexity CEO Aravind Srinivas 在发布时这样定义:
"Brain is a self-improving context-graph of all your sessions, connectors, and files. Brain updates itself overnight with fresh context proactively, and feeds itself to every task on Computer."
这句话的核心信息是:Brain 不是又一个「记住用户偏好」的功能,而是一个让 Agent 记住自己工作历史的系统。
1.1 AI 记忆的三代演进
回顾 AI 记忆的发展,可以清晰地看到三个范式:
第一代:个人记忆(Personal Memory)。 以 ChatGPT Memory(2024 年 2 月上线)为代表。它记住的是用户的偏好——"我喜欢用 bullet points"、"我是 Python 开发者"、"我的猫叫 Luna"。本质上是用户画像的持久化。
第二代:项目记忆(Project Memory)。 以 Claude Projects(2024 Q3)和 claude.md 为代表。记忆从「用户级」下沉到「项目级」——一个项目有自己的上下文、规则、文件索引。这是协作记忆的雏形。
第三代:工作记忆(Working Memory)。 以 Perplexity Brain(2026 年 6 月)为代表。记忆的主体不再是用户,而是 Agent 自身的工作过程——它做过什么、做错了什么、学到了什么。这是真正意义上的自我改进记忆。
这三代演进的本质变化是:记忆的主体从「人」转移到了「Agent」。
💡 一句话理解
Brain 的核心理念可以用一句话概括:最好的记忆不是「你告诉 AI 什么」,而是「AI 自己学到了什么」。
⚠️ 常见踩坑
工作记忆 ≠ 模型微调。Brain 不改变模型权重,而是在推理时注入历史上下文——这意味着它是零训练成本的「记忆增强」。
二、Brain 的技术架构:活上下文图谱
Brain 的底层是一个 Perplexity 称为 "Living Context Graph"(活上下文图谱) 的数据结构。理解这个图谱是理解整个系统的关键。
2.1 上下文图谱的节点类型
上下文图谱不是简单的向量数据库,而是一个异构知识图谱。它包含以下节点类型:
- Session 节点:每次 Agent 执行的任务,包括输入、输出、工具调用序列
- Connector 节点:Agent 连接的外部数据源(Slack、GitHub、Google Drive 等)
- File 节点:Agent 处理过的文件及其版本
- Decision 节点:Agent 做出的关键决策及其理由
- Correction 节点:用户或系统对 Agent 输出的纠正——这是最有价值的节点
2.2 夜间合成机制
Brain 最独特的设计是夜间自动合成(Overnight Synthesis)。白天,Agent 正常执行任务,所有交互被记录到上下文图谱。夜间(低负载时段),一个专门的合成 Pipeline 启动:
- 增量扫描:只处理当天新增的节点
- 冲突检测:发现矛盾信息(如文件 A 的路径昨天是 /x,今天变成了 /y)
- 知识蒸馏:将多个 Session 节点的细节压缩为高层摘要
- 纠错标记:将 Correction 节点提升为高优先级规则
- 图谱更新:将合成结果写回图谱,供次日使用
这个过程类似于人类睡眠时的记忆巩固(Memory Consolidation)——大脑在睡眠中将短期记忆转化为长期记忆,剔除噪声,强化重要信息。
💡 一句话理解
夜间合成机制的关键设计决策是「增量处理」——只扫描当天新增节点,而非全量重建。这使得合成成本随时间线性增长而非指数增长。
⚠️ 常见踩坑
夜间合成需要消耗计算资源。Perplexity 将其安排在低负载时段(用户所在时区的凌晨),但对于跨时区团队,可能需要配置合成窗口。
三、效果数据:25% 正确率提升的背后
Perplexity 公布了三组核心数据(来自内部测试,尚未经过第三方验证):
| 指标 | 提升幅度 | 含义 |
|---|---|---|
| 任务正确率 | +25% | Agent 在重复或相似任务上犯错更少 |
| 上下文召回率 | +16% | Agent 能更完整地引用历史信息 |
| 任务成本 | -13% | 减少重复探索,token 消耗降低 |
3.1 为什么正确率能提升 25%?
关键在于 Correction 节点的权重机制。当用户纠正了 Agent 的一个错误(比如"不要用 lodash,我们用原生 ES Modules"),这条纠正会被:
- 记录为 Correction 节点
- 在夜间合成中被标记为高优先级规则
- 在后续任务中,当 Agent 检测到相似上下文时,自动注入这条规则
这相当于给 Agent 加了一个自我纠错的反馈循环——不需要人工编写 system prompt,Agent 自己从错误中学习。
3.2 成本降低 13% 的来源
成本降低主要来自两个方面:
减少重复探索。 没有记忆的 Agent 每次遇到类似问题都要重新搜索、重新推理。Brain 让 Agent 能直接引用之前的工作结果,跳过探索阶段。
更精准的上下文注入。 传统方案是「把所有历史对话塞进上下文窗口」,Brain 的做法是「只注入与当前任务相关的合成摘要」——上下文利用效率更高,token 浪费更少。
# Brain 记忆检索的简化伪代码
class BrainMemoryRetriever:
def retrieve(self, current_task: Task) -> ContextBundle:
# 1. 从上下文图谱中检索相关节点
relevant_nodes = self.graph.search(
query=current_task.embedding,
node_types=["session", "decision", "correction"],
time_decay=True, # 近期记忆权重更高
)
# 2. 过滤:只保留与当前任务类型匹配的节点
filtered = [
node for node in relevant_nodes
if node.task_type == current_task.type
and node.confidence > 0.7
]
# 3. 合成:将多个节点压缩为上下文摘要
synthesized = self.synthesizer.compress(
nodes=filtered,
max_tokens=2048, # 控制注入量
priority_order=["correction", "decision", "session"],
)
# 4. 注入:作为系统上下文附加到任务
return ContextBundle(
system_context=synthesized,
source_links=[n.source_url for n in filtered],
)💡 一句话理解
Correction 节点是 Brain 最有价值的设计。它让 Agent 的记忆不再是「流水账」,而是「错题本」——记住错误比记住成功更有价值。
⚠️ 常见踩坑
25% 的正确率提升是 Perplexity 内部数据,针对的是「重复或相似任务」。对于全新任务(没有历史上下文可参考),提升可能显著低于这个数字。
四、竞品对比:Brain vs ChatGPT Memory vs Claude Projects vs Engram
2026 年 6 月的 Agent 记忆赛道已经非常拥挤。让我们从多个维度对比四个主要方案:
4.1 设计哲学对比
| 维度 | ChatGPT Memory | Claude Projects | Weaviate Engram | Perplexity Brain |
|---|---|---|---|---|
| 记忆主体 | 用户 | 项目 | Agent 交互 | Agent 工作过程 |
| 更新方式 | 实时 | 实时 | 异步 Pipeline | 夜间合成 |
| 存储结构 | KV 对 | 文件系统 | 向量 + 图 | 异构知识图谱 |
| 自改进 | ❌ | ❌ | ❌ | ✅ |
| 纠错学习 | ❌ | 手动配置 | ❌ | ✅ 自动 |
| 多 Agent 共享 | ❌ | ✅ 项目内 | ✅ 权限隔离 | 部分(团队级) |
| 开源 | ❌ | ❌ | ✅(Weaviate) | ❌ |
4.2 技术路线差异
Brain 与 Engram(agent-084)的核心差异在于记忆的处理方式:
- Engram 是一个记忆基础设施——它提供记忆的存储、检索、权限管理,但「记什么」和「怎么用」由应用层决定
- Brain 是一个记忆应用——它不仅提供存储,还内置了合成、纠错、优先级排序等智能逻辑
用数据库类比:Engram 是 MySQL(通用存储引擎),Brain 是 Notion(带智能视图的知识管理应用)。
4.3 锁定效应分析
Brain 创造了一种独特的工作记忆锁定效应:一个使用了 6 个月的 Computer Agent 实例,积累了大量特定团队的工作历史、纠错记录和决策上下文——迁移到另一个 Agent 平台意味着丢失所有这些工作记忆。
这比 ChatGPT Memory 的锁定更强——用户偏好可以手动重建,但 6 个月的工作历史无法复制。
💡 一句话理解
选择记忆方案的关键问题:你需要的是「基础设施」(选 Engram 自建)还是「开箱即用的应用」(选 Brain 托管)?
⚠️ 常见踩坑
Brain 的锁定效应是把双刃剑——对企业来说,深度绑定单一供应商的 Agent 记忆存在合规风险。关注 Perplexity 是否提供记忆导出功能。
五、对 Agentic AI 的深远影响
Brain 的发布不仅是产品更新,它标志着 Agentic AI 竞争轴心的转移。
5.1 竞争轴心:从「模型智能」到「记忆复利」
过去两年,AI Agent 的竞争焦点是底层模型有多聪明——谁的 benchmark 分数更高、谁的推理能力更强。Brain 提出了一个不同的命题:谁的 Agent 能积累更多有用的工作记忆,谁就能在实际任务中表现更好。
这意味着:
- 一个使用 Brain 6 个月的「老 Agent」,即使底层模型不变,其任务表现也会持续优于「新 Agent」
- Agent 的价值不再只是「聪明」,而是「有经验」——就像人类员工一样
- 记忆复利成为新的竞争壁垒
5.2 对开发者的启示
如果你在做 Agent 产品: Brain 证明了「自改进记忆」是一个可行的产品形态。考虑在你的 Agent 中加入类似机制——不需要从零构建,可以基于 Engram 或 Mem0 搭建。
如果你在用 Agent 产品: 选择有记忆能力的平台。一个没有记忆的 Agent 永远在「从零开始」,一个有记忆的 Agent 会「越用越好」。
如果你在做 AI 基础设施: 记忆层是下一个蓝海。Engram、Mem0、Zep 只是开始——未来的 Agent 技术栈中,记忆层将与模型层、工具层并列为三大核心组件。
5.3 未解决的问题
Brain 也面临几个尚未回答的问题:
- 隐私边界:Agent 记住了所有工作历史,包括敏感信息。企业级部署需要细粒度的隐私控制
- 记忆污染:如果 Agent 从错误中「学到了错误的教训」怎么办?合成机制需要防止过度泛化
- 可解释性:当 Brain 注入的历史上下文影响了 Agent 的决策,用户能否理解「为什么 Agent 这样做」?
- 跨平台迁移:工作记忆的锁定效应是否会阻碍市场竞争?
💡 一句话理解
Brain 的核心洞察:Agent 的价值 = 模型能力 × 记忆积累。模型能力有天花板,但记忆积累可以持续复利。
⚠️ 常见踩坑
记忆污染是一个被低估的风险。如果 Brain 的夜间合成将个别案例错误地泛化为通用规则,可能导致 Agent 在后续任务中系统性地犯错。