💡

文章摘要

2026 年 6 月 18 日,Perplexity 发布 Brain——一个为 Agentic AI 设计的自改进记忆系统。与 ChatGPT Memory 记住用户偏好不同,Brain 记住的是 Agent 自己犯过的错误。它构建「活上下文图谱」,夜间自动综合更新,使任务正确率提升 25%、召回率提升 16%、成本降低 13%。本文从架构设计、记忆合成机制、与竞品对比、到对 Agentic AI 的深远影响,全面解析这一范式转变。

一、从「记住你」到「记住错误」——AI 记忆的范式转变

2026 年 6 月 18 日Perplexity 发布了 Brain——一个嵌入其 Computer Agent 产品的自改进记忆系统。Perplexity CEO Aravind Srinivas 在发布时这样定义:

"Brain is a self-improving context-graph of all your sessions, connectors, and files. Brain updates itself overnight with fresh context proactively, and feeds itself to every task on Computer."

这句话的核心信息是:Brain 不是又一个「记住用户偏好」的功能,而是一个让 Agent 记住自己工作历史的系统。

1.1 AI 记忆的三代演进

回顾 AI 记忆的发展,可以清晰地看到三个范式:

第一代:个人记忆(Personal Memory)。 以 ChatGPT Memory(2024 年 2 月上线)为代表。它记住的是用户的偏好——"我喜欢用 bullet points"、"我是 Python 开发者"、"我的猫叫 Luna"。本质上是用户画像的持久化

第二代:项目记忆(Project Memory)。 以 Claude Projects(2024 Q3)和 claude.md 为代表。记忆从「用户级」下沉到「项目级」——一个项目有自己的上下文、规则、文件索引。这是协作记忆的雏形

第三代:工作记忆Working Memory)。Perplexity Brain(2026 年 6 月)为代表。记忆的主体不再是用户,而是 Agent 自身的工作过程——它做过什么、做错了什么、学到了什么。这是真正意义上的自我改进记忆

这三代演进的本质变化是:记忆的主体从「人」转移到了「Agent」。

图表加载中…

💡 一句话理解

Brain 的核心理念可以用一句话概括:最好的记忆不是「你告诉 AI 什么」,而是「AI 自己学到了什么」。

⚠️ 常见踩坑

工作记忆 ≠ 模型微调。Brain 不改变模型权重,而是在推理时注入历史上下文——这意味着它是零训练成本的「记忆增强」。

二、Brain 的技术架构:活上下文图谱

Brain 的底层是一个 Perplexity 称为 "Living Context Graph"(活上下文图谱) 的数据结构。理解这个图谱是理解整个系统的关键。

2.1 上下文图谱的节点类型

上下文图谱不是简单的向量数据库,而是一个异构知识图谱。它包含以下节点类型:

  • Session 节点:每次 Agent 执行的任务,包括输入、输出、工具调用序列
  • Connector 节点:Agent 连接的外部数据源(Slack、GitHub、Google Drive 等)
  • File 节点:Agent 处理过的文件及其版本
  • Decision 节点:Agent 做出的关键决策及其理由
  • Correction 节点:用户或系统对 Agent 输出的纠正——这是最有价值的节点

2.2 夜间合成机制

Brain 最独特的设计是夜间自动合成(Overnight Synthesis)。白天,Agent 正常执行任务,所有交互被记录到上下文图谱。夜间(低负载时段),一个专门的合成 Pipeline 启动:

  1. 增量扫描:只处理当天新增的节点
  2. 冲突检测:发现矛盾信息(如文件 A 的路径昨天是 /x,今天变成了 /y)
  3. 知识蒸馏:将多个 Session 节点的细节压缩为高层摘要
  4. 纠错标记:将 Correction 节点提升为高优先级规则
  5. 图谱更新:将合成结果写回图谱,供次日使用

这个过程类似于人类睡眠时的记忆巩固(Memory Consolidation)——大脑在睡眠中将短期记忆转化为长期记忆,剔除噪声,强化重要信息。

图表加载中…

💡 一句话理解

夜间合成机制的关键设计决策是「增量处理」——只扫描当天新增节点,而非全量重建。这使得合成成本随时间线性增长而非指数增长。

⚠️ 常见踩坑

夜间合成需要消耗计算资源。Perplexity 将其安排在低负载时段(用户所在时区的凌晨),但对于跨时区团队,可能需要配置合成窗口。

三、效果数据:25% 正确率提升的背后

Perplexity 公布了三组核心数据(来自内部测试,尚未经过第三方验证):

指标 提升幅度 含义
任务正确率 +25% Agent 在重复或相似任务上犯错更少
上下文召回率 +16% Agent 能更完整地引用历史信息
任务成本 -13% 减少重复探索,token 消耗降低

3.1 为什么正确率能提升 25%?

关键在于 Correction 节点的权重机制。当用户纠正了 Agent 的一个错误(比如"不要用 lodash,我们用原生 ES Modules"),这条纠正会被:

  1. 记录为 Correction 节点
  2. 在夜间合成中被标记为高优先级规则
  3. 在后续任务中,当 Agent 检测到相似上下文时,自动注入这条规则

这相当于给 Agent 加了一个自我纠错的反馈循环——不需要人工编写 system prompt,Agent 自己从错误中学习。

3.2 成本降低 13% 的来源

成本降低主要来自两个方面:

减少重复探索。 没有记忆的 Agent 每次遇到类似问题都要重新搜索、重新推理。Brain 让 Agent 能直接引用之前的工作结果,跳过探索阶段。

更精准的上下文注入。 传统方案是「把所有历史对话塞进上下文窗口」,Brain 的做法是「只注入与当前任务相关的合成摘要」——上下文利用效率更高,token 浪费更少。

python
# Brain 记忆检索的简化伪代码
class BrainMemoryRetriever:
    def retrieve(self, current_task: Task) -> ContextBundle:
        # 1. 从上下文图谱中检索相关节点
        relevant_nodes = self.graph.search(
            query=current_task.embedding,
            node_types=["session", "decision", "correction"],
            time_decay=True,  # 近期记忆权重更高
        )

        # 2. 过滤:只保留与当前任务类型匹配的节点
        filtered = [
            node for node in relevant_nodes
            if node.task_type == current_task.type
            and node.confidence > 0.7
        ]

        # 3. 合成:将多个节点压缩为上下文摘要
        synthesized = self.synthesizer.compress(
            nodes=filtered,
            max_tokens=2048,  # 控制注入量
            priority_order=["correction", "decision", "session"],
        )

        # 4. 注入:作为系统上下文附加到任务
        return ContextBundle(
            system_context=synthesized,
            source_links=[n.source_url for n in filtered],
        )

💡 一句话理解

Correction 节点是 Brain 最有价值的设计。它让 Agent 的记忆不再是「流水账」,而是「错题本」——记住错误比记住成功更有价值。

⚠️ 常见踩坑

25% 的正确率提升是 Perplexity 内部数据,针对的是「重复或相似任务」。对于全新任务(没有历史上下文可参考),提升可能显著低于这个数字。

四、竞品对比:Brain vs ChatGPT Memory vs Claude Projects vs Engram

2026 年 6 月的 Agent 记忆赛道已经非常拥挤。让我们从多个维度对比四个主要方案:

4.1 设计哲学对比

维度 ChatGPT Memory Claude Projects Weaviate Engram Perplexity Brain
记忆主体 用户 项目 Agent 交互 Agent 工作过程
更新方式 实时 实时 异步 Pipeline 夜间合成
存储结构 KV 对 文件系统 向量 + 图 异构知识图谱
自改进
纠错学习 手动配置 ✅ 自动
多 Agent 共享 ✅ 项目内 ✅ 权限隔离 部分(团队级)
开源 ✅(Weaviate

4.2 技术路线差异

Brain 与 Engram(agent-084)的核心差异在于记忆的处理方式

  • Engram 是一个记忆基础设施——它提供记忆的存储、检索、权限管理,但「记什么」和「怎么用」由应用层决定
  • Brain 是一个记忆应用——它不仅提供存储,还内置了合成、纠错、优先级排序等智能逻辑

用数据库类比:Engram 是 MySQL(通用存储引擎),Brain 是 Notion(带智能视图的知识管理应用)。

4.3 锁定效应分析

Brain 创造了一种独特的工作记忆锁定效应:一个使用了 6 个月的 Computer Agent 实例,积累了大量特定团队的工作历史、纠错记录和决策上下文——迁移到另一个 Agent 平台意味着丢失所有这些工作记忆

这比 ChatGPT Memory 的锁定更强——用户偏好可以手动重建,但 6 个月的工作历史无法复制。

💡 一句话理解

选择记忆方案的关键问题:你需要的是「基础设施」(选 Engram 自建)还是「开箱即用的应用」(选 Brain 托管)?

⚠️ 常见踩坑

Brain 的锁定效应是把双刃剑——对企业来说,深度绑定单一供应商的 Agent 记忆存在合规风险。关注 Perplexity 是否提供记忆导出功能。

五、对 Agentic AI 的深远影响

Brain 的发布不仅是产品更新,它标志着 Agentic AI 竞争轴心的转移。

5.1 竞争轴心:从「模型智能」到「记忆复利」

过去两年,AI Agent 的竞争焦点是底层模型有多聪明——谁的 benchmark 分数更高、谁的推理能力更强。Brain 提出了一个不同的命题:谁的 Agent 能积累更多有用的工作记忆,谁就能在实际任务中表现更好。

这意味着:

  • 一个使用 Brain 6 个月的「老 Agent」,即使底层模型不变,其任务表现也会持续优于「新 Agent」
  • Agent 的价值不再只是「聪明」,而是「有经验」——就像人类员工一样
  • 记忆复利成为新的竞争壁垒

5.2 对开发者的启示

如果你在做 Agent 产品: Brain 证明了「自改进记忆」是一个可行的产品形态。考虑在你的 Agent 中加入类似机制——不需要从零构建,可以基于 EngramMem0 搭建。

如果你在用 Agent 产品: 选择有记忆能力的平台。一个没有记忆的 Agent 永远在「从零开始」,一个有记忆的 Agent 会「越用越好」。

如果你在做 AI 基础设施: 记忆层是下一个蓝海。EngramMem0、Zep 只是开始——未来的 Agent 技术栈中,记忆层将与模型层、工具层并列为三大核心组件。

5.3 未解决的问题

Brain 也面临几个尚未回答的问题:

  1. 隐私边界:Agent 记住了所有工作历史,包括敏感信息。企业级部署需要细粒度的隐私控制
  2. 记忆污染:如果 Agent 从错误中「学到了错误的教训」怎么办?合成机制需要防止过度泛化
  3. 可解释性:当 Brain 注入的历史上下文影响了 Agent 的决策,用户能否理解「为什么 Agent 这样做」?
  4. 跨平台迁移工作记忆的锁定效应是否会阻碍市场竞争?

💡 一句话理解

Brain 的核心洞察:Agent 的价值 = 模型能力 × 记忆积累。模型能力有天花板,但记忆积累可以持续复利。

⚠️ 常见踩坑

记忆污染是一个被低估的风险。如果 Brain 的夜间合成将个别案例错误地泛化为通用规则,可能导致 Agent 在后续任务中系统性地犯错。