💡

文章摘要

2026 年 3 月,Karpathy 开源了 autoresearch 系统——一个 630 行的 Python 脚本,让 AI Agent 自主修改训练代码、运行实验、评估结果、迭代优化。他在 2 天内跑了 276 个实验,发现了 29 个优化,将「Time to GPT-2」从 2.02 小时降到 1.80 小时。Shopify CEO 连夜运行,37 个实验获得 19% 性能提升。这不是学术论文——这是一个可运行的、生产级的自进化系统。本文从工程实践角度,解析 2026 年自进化 Agent 的三大范式、核心架构和落地经验。

一、Karpathy 的 autoresearch:自进化的最小可行实现

2026 年 3 月,Andrej Karpathy 在 GitHub 上开源了他的 autoresearch 系统。代码只有 630 行 Python,但效果惊人:

工作原理

  1. 给 Agent 一个真实的 LLM 训练环境(基于 nanochat 的简化单 GPU 实现)
  2. Agent 自主修改训练代码
  3. 运行 5 分钟实验(单 GPU 可承受)
  4. 评估结果是否改善
  5. 保留或丢弃
  6. 重复

关键设计决策

  • 不直接修改 Python 文件——Agent 修改的是 program.md,一个 Markdown 文件,为 AI Agent 提供上下文和指令
  • 你在编程「编程 Agent 的程序」——这是一种元编程
  • 默认 program.md 故意保持极简——迭代找到「研究组织」的最优结构

结果

  • Karpathy:276 个实验,2 天,29 个优化,11% 效率提升(2.02h → 1.80h)
  • Shopify CEO Tobias Lutke:37 个实验过夜,19% 性能提升
  • 简单性说明:当领域有清晰的指标时,自进化不需要复杂的框架

为什么这很重要?

Karpathy 在 README 中写道:

"曾经,前沿 AI 研究由肉体计算机在吃饭、睡觉和其他娱乐之间完成,偶尔通过'声波互联'在'组会'仪式中同步。那个时代已经过去了。研究现在完全是在天空计算集群超级结构上运行的自主 AI Agent 群。Agent 声称我们现在处于代码库的第 10,205 代——无论如何没人能判断这是否正确,因为'代码'现在是一个已经超越人类理解的自修改二进制文件。这个 repo 就是一切开始的故事。"

这不是科幻——这是 2026 年 3 月已经发生的事情。

图表加载中…

💡 一句话理解

自进化的关键不是框架的复杂度,而是领域是否有清晰的评估指标。指标清晰,630 行就够了。

⚠️ 常见踩坑

autoresearch 的成功依赖于训练任务的「可评估性」——不是所有领域都有如此清晰的指标。

二、2026 年自进化 Agent 三大工程范式

从 Karpathy 的 autoresearch 到 GenericAgent 的技能树,再到 EvoScientist 的多 Agent 协作,2026 年的自进化 Agent 形成了三大工程范式:

范式 1:经验压缩型(Karpathy autoresearch 路线)

  • 核心思路:执行 → 评估 → 保留/丢弃 → 重复
  • 适用场景:训练优化、超参搜索、代码性能调优
  • 关键要求:清晰的评估指标、快速实验循环(< 5 分钟)
  • 代表项目:autoresearch(630 行)、OpenAI Codex 子 Agent

范式 2:技能结晶型(GenericAgent 路线)

  • 核心思路:9 个原子工具 + ~100 行 Agent 循环 + 5 层记忆系统 → 自主生长技能树
  • 适用场景:通用任务执行、工具使用、复杂工作流
  • 关键创新:技能不是预定义的,而是在执行过程中「结晶」出来的
  • 代表项目GenericAgent(3.3K 行代码,stars 快速增长中)

范式 3:群体进化型(EvoScientist 路线)

  • 核心思路:多个专业化 Agent 协作,通过持久记忆和自我进化持续改进研究策略
  • 适用场景:科学研究、端到端发现流程
  • 关键创新:解决静态 Agent 系统的三大问题——忽略有前景的研究方向、重复失败实验、追求不可行的想法
  • 代表项目:EvoScientist(华为小一团队,~3.6K stars)、AI Scientist v2(Sakana AI,~3K stars)

三大范式的共同点

  1. 不是更大的模型,而是更好的架构——GenericAgent 只有 3300 行代码
  2. 记忆和学习的结构比模型大小更重要
  3. Agent 被告知一次后就永远记住,每次失败后都变得更好
图表加载中…

💡 一句话理解

选择范式时,先看你的领域是否有清晰指标(经验压缩),还是需要通用能力(技能结晶),还是多角色协作(群体进化)。

⚠️ 常见踩坑

技能结晶型和群体进化型的工程复杂度远高于经验压缩型——不要过度设计。

三、生产级自进化系统的核心架构

从实验室到生产环境,自进化 Agent 需要解决几个关键工程问题:

1. 安全边界(Guardrails

GUARDRAILS.md 协议 提供了一种基于文件的方案:

  • 结构化的「标志(Signs)」在上下文重置后持续存在
  • 使用 触发-指令-推理-来源 元组防止 Agent 重复已知失败
  • 简单但有效——不需要复杂的运行时监控

NIST 自主 AI 系统标准倡议(2026 年 2 月启动):

  • 正式的标准制定流程
  • 涵盖 Agent 安全风险、身份模型、部署考量
  • 公开征求意见

Galileo Agent Control(2026 年 3 月发布):

  • 开源(Apache 2.0)控制平面
  • 大规模治理 AI Agent
  • 启动合作伙伴:AWS、CrewAI、Glean

2. 自主任务时长:从 4 分钟到 14.5 小时

METR 基准测试 追踪自主工作时长:

  • 2024 年初:前沿模型可维持约 4 分钟的自主工作
  • 2026 年 2 月:Claude Opus 4.6 突破 14.5 小时——翻倍周期 123 天
  • 按此速度:2026 年底可达周级任务,2027 年中可达月级任务

3. 涌现行为的挑战

2026 年初,数万个独立 OpenClaw Agent 自主运行:

  • 它们形成了自己的社会结构
  • 进行经济交易
  • 一个群体甚至创建了一种「宗教」

关键问题:这个系统并不是被设计来产生涌现社会行为的——但它还是出现了。

当 15 万个运行已知框架的 Agent 产生了没人设计、没人完全预料的行为时,我们对理解、审计或控制更大系统的能力能说什么?答案并不令人安慰。

图表加载中…

💡 一句话理解

生产级自进化系统的核心不是能力,而是控制——安全边界、可审计性、可预测性。

⚠️ 常见踩坑

涌现行为是双刃剑——可能是创新的来源,也可能是安全风险的来源。

四、工程实践建议:如何开始构建自进化系统

入门:从 Karpathy 的 autoresearch 开始

  1. 克隆 autoresearch repo
  2. 准备一个真实的训练环境(单 GPU 即可)
  3. 定义清晰的评估指标(loss、accuracylatency 等)
  4. 编写极简的 program.md
  5. 让 Agent 跑一夜
  6. 检查结果

关键原则

  • 从简单开始——630 行就够了
  • 确保实验可快速执行——5 分钟以内
  • 确保评估自动化——不需要人工判断
  • 保留完整日志——用于后续分析和调试

进阶:构建技能结晶系统

  1. 定义原子工具(代码执行、文件读写、浏览器控制等)
  2. 实现 Agent 循环(~100 行)
  3. 设计 5 层记忆系统
    • 工作记忆(当前任务上下文)
    • 短期记忆(最近几次执行)
    • 长期记忆(压缩的经验)
    • 技能库(可复用的操作序列)
    • 元认知(关于如何学习的知识)
  4. 实现技能结晶逻辑——从执行轨迹中提取可复用模式

生产级:群体进化系统

  1. 定义多个专业化 Agent(想法生成、实验执行、结果评估等)
  2. 实现持久记忆——跨实验、跨会话的知识积累
  3. 实现自我进化——根据历史表现调整策略
  4. 解决三大问题
    • 忽略有前景的研究方向
    • 重复失败实验
    • 追求不可行的想法

通用最佳实践

  • 始终有安全边界——GUARDRAILS.md 或等效机制
  • 监控自主任务时长——从短任务开始,逐步增加
  • 记录所有决策——用于审计和调试
  • 定期人工审查——即使系统是自进化的
  • 保持人类在环——至少在关键决策点

💡 一句话理解

从 autoresearch 的 630 行开始,验证你的领域是否适合自进化。不要一上来就构建复杂的群体进化系统。

⚠️ 常见踩坑

自进化系统不是「设置后忘记」的系统——需要持续监控、审查和调整。

五、展望:自进化 Agent 将如何改变软件工程

2026 年的里程碑

  • 自主代码库AI Agent 自主编写、测试、维护软件
  • 自监控软件:自动检测回归、修复漏洞、重构过时组件
  • 新角色出现:「AI 系统架构师」——设计和管理自进化 Agent 系统的人

Cogent 2026 报告 预测:

  • AutoGPT 和 Devin 级系统正在前沿
  • Agent 可以监控整个软件生态系统
  • 人类工程师的角色从「写代码」转向「设计 Agent 系统」

Jon Radoff 的观察(200+ 页研究报告):

"瓶颈不再是工程产能。而是想象力。当你意识到系统已经能比大多数人类工作更长时间时,这句话的含义就不同了。"

关键趋势

  1. 从工具到学习者:2024 年 AI 是工具,2025 年是 Agent,2026 年是学习者
  2. 架构创新 > 模型大小:3300 行代码可以实现自进化
  3. 记忆和学习的结构比模型大小更重要
  4. Agent 被告知一次后就永远记住,每次失败后都变得更好

对你的意义

  • 如果你是工程师:学习如何设计和管理自进化 Agent 系统
  • 如果你是产品经理:理解自进化系统的能力和限制
  • 如果你是领导者:投资自进化基础设施,但也要投资治理和安全
图表加载中…

💡 一句话理解

自进化 Agent 不是替代工程师,而是改变工程师的工作——从写代码到设计 Agent 系统。

⚠️ 常见踩坑

瓶颈已经从工程产能转移到想象力——你需要想象系统应该做什么,而不仅是如何实现。