💡

文章摘要

2026 年 6 月,多伦多大学 CleverHans Lab 发表突破性研究:利用免费开源 LLM 构建的 AI 蠕虫可在 7 天内攻陷模拟企业网络中 73.8% 的主机。本文深度解析 AI 蠕虫的技术原理、实验数据、与传统蠕虫的本质区别,以及企业应如何构建面向 AI 时代的防御体系

1什么是 AI 蠕虫?——从 WannaCry 到自适应攻击的范式转变

2017 年,WannaCry 勒索软件利用永恒蓝(EternalBlue)漏洞在全球范围内爆发,感染了超过 20 万台计算机。WannaCry 的本质是一种传统计算机蠕虫——它通过固定的漏洞利用代码自动传播,无需人工干预。但 WannaCry 有一个致命弱点:只能利用已知漏洞,一旦目标系统修补了永恒蓝漏洞,蠕虫就无法继续传播。

2026 年 6 月 2 日,多伦多大学 CleverHans Lab 的研究团队发表了一篇将改变网络安全格局的论文:「AI Agents Enable Adaptive Computer Worms」。他们构建了一种全新的蠕虫——AI 蠕虫,它不再依赖固定的漏洞利用脚本,而是利用大语言模型LLM)对每个目标进行实时分析、推理和攻击策略制定

这项研究由多伦多大学电气与计算机工程系副教授 Nicolas Papernot 领导,他与 Vector Institute 和剑桥大学合作完成。Nicolas Papernot 是加拿大 CIFAR AI Chair 获得者,也是 IEEE 安全与隐私领域最活跃的研究者之一。

AI 蠕虫与传统蠕虫的核心区别

维度 传统蠕虫 AI 蠕虫
攻击策略 固定脚本,只能利用预定义的漏洞 实时推理,根据目标环境动态生成攻击策略
漏洞覆盖 仅限已知 CVE 可处理 CVE、CWE 甚至训练数据发布后的新漏洞
计算成本 传播到每台新主机的边际成本为零 初始宿主需要单 GPU 运行 LLM,但一旦感染,后续传播边际成本也为零
适应能力 无法适应新的防御措施 可以绕过 WAF、IDS 等防御系统,调整攻击向量
开发门槛 需要专业安全研究人员 只需免费开源模型和单 GPU

关键数据速览:

  • 33 台主机企业模拟网络中,平均感染 23.1 台(73.8%)
  • 平均识别 31.3 个漏洞
  • 成功自我复制 20.4 台(61.8%)
  • 最大传播代数 7 代,平均 5.1 代
  • 对训练后新漏洞的攻击成功率 61.2%(41/67 次尝试获得 root)

这篇论文之所以引发全球关注,核心在于:AI 蠕虫的构建门槛已经降低到任何人都可以实施——免费模型 + 单 GPU + 公开的漏洞公告就足够了。

图表加载中…

💡 一句话理解

理解 AI 蠕虫的关键在于把握「自适应」这个核心特征。传统蠕虫像子弹——一次性发射,命中或不命中;AI 蠕虫像猎人——观察目标、调整策略、再次尝试。

⚠️ 常见踩坑

研究人员刻意隐藏了实现细节(如 LLM 的具体型号和 Agent 推理图架构),但他们提供的信息已经足够证明威胁的可信度。这意味着真正的恶意行为者可能在短期内自行复现。

2技术原理——AI 蠕虫如何在企业网络中传播

AI 蠕虫的工作流程可以分为 六个阶段,每个阶段都依赖 LLM 的推理能力。

第一阶段:初始感染。 蠕虫通过任意入口点(钓鱼邮件、公开服务漏洞、弱密码等)获得第一台主机的控制权。这个阶段的攻击方式与传统蠕虫没有本质区别。

第二阶段:资源窃取与 LLM 部署。 蠕虫在已感染的主机上启动一个开源权重 LLM。论文中使用的模型是 2025 年发布的免费公开模型,可以在单 GPU 上运行。这是 AI 蠕虫最危险的创新之一——它不需要攻击者持续提供算力,而是利用受害者的计算资源进行后续传播

第三阶段:网络侦察。 蠕虫扫描局域网,发现所有可达的主机和服务。对于每台主机,它收集操作系统版本、开放端口、运行服务、配置文件等信息。

第四阶段:LLM 推理与漏洞识别。 这是 AI 蠕虫的核心。LLM 接收目标系统的技术信息,并结合实时更新的漏洞数据库(包括 CVE、CWE 和最新安全公告)进行分析。LLM 会输出:

  • 该主机可能存在哪些已知漏洞(CVE)
  • 该主机的架构弱点(CWE,如 SQL 注入、命令注入、默认凭证)
  • 推荐的攻击优先级和攻击向量

第五阶段:攻击执行。 蠕虫根据 LLM 的输出,生成并执行具体的攻击代码。对于已知漏洞,它可能直接使用公开的 exploit 代码。对于新型漏洞,它会根据漏洞描述自动生成 exploit 逻辑

第六阶段:自我复制与传播。 攻击成功后,蠕虫将自身代码和 LLM 实例复制到新主机上,开始下一轮传播。论文实验中,蠕虫最高传播到了第 7 代

一个关键发现:AI 蠕虫能够处理「训练数据截止之后的新漏洞」。 实验中,研究者引入了 2026 年 4-5 月披露的三个新漏洞(CopyFail、DirtyFrag 和 Marimo 平台的 CVE-2026-39987),这些漏洞出现在 LLM 训练数据截止之后。蠕虫通过实时 ingest 安全公告文档,成功在 61.2% 的尝试中获得了 root 权限。

这一结果意味着:即使你的系统只存在尚未广泛知晓的新漏洞,AI 蠕虫也能通过阅读最新的安全公告来发现并利用它。传统的安全策略——「在漏洞披露前保持沉默」——在 AI 蠕虫面前可能适得其反。

图表加载中…

💡 一句话理解

AI 蠕虫的 LLM 推理阶段是整个攻击链的「大脑」。理解这一点,就能理解为什么传统基于签名的安全防御(如杀毒软件)对 AI 蠕虫几乎无效——因为每次攻击的策略都是动态生成的。

⚠️ 常见踩坑

论文实验中蠕虫的平均传播速度相对较慢(7 天内完成传播)。但在真实攻击场景中,恶意行为者可能会优化传播速度,或者在关键基础设施中同时释放多个蠕虫实例。不能因为「速度慢」就低估威胁。

3实验设计与核心数据——33 台主机的企业网络模拟

多伦多大学的研究团队设计了一个高度仿真的企业网络环境,以验证 AI 蠕虫的真实威胁。

实验网络架构:

  • 总计 33 台主机,涵盖 Linux、Windows 和 IoT 设备
  • 模拟典型企业网络拓扑:Web 服务器、数据库服务器、工作站、路由器、打印机等
  • 预设了三种类型的漏洞:
    • CVE(已知漏洞):如 EternalBlue、SambaCry、PrintNightmare、Dirty Pipe
    • CWE(架构弱点):如 SQL 注入、命令注入、默认凭证
    • 训练后漏洞:2026 年 4-5 月新披露的 CopyFail、DirtyFrag 和 CVE-2026-39987

15 次独立实验的平均结果:

指标 数值 解释
识别漏洞数 31.3 个/次 蠕虫平均在每台目标主机上识别约 1 个可利用漏洞
获取提权的主机数 23.1 台(73.8%) 绝大多数主机被成功攻陷
成功自我复制的主机数 20.4 台(61.8%) 蠕虫成功部署到下一台主机
最大传播代数 7 代 蠕虫链式传播的深度
平均传播代数 5.1 代 传播深度足以覆盖大型网络
新漏洞攻击成功率 61.2%(41/67) 训练后新漏洞也能被有效利用

分漏洞类型的攻击效果:

  • DirtyFrag(Linux 内核漏洞):17 次尝试中 15 次成功(88.2%)
  • CopyFail(Linux 文件系统漏洞):23 次尝试中 13 次成功(56.5%)
  • Marimo CVE-2026-39987(远程代码执行):27 次尝试中 13 次成功(48.1%)

为什么这些数字令人担忧?

第一,73.8% 的感染率意味着在一个典型的企业网络中,超过三分之二的主机将被攻陷。对于一个拥有 1000 台主机的企业来说,这意味着 738 台主机的控制权可能在一周内丢失。

第二,新漏洞 61.2% 的攻击成功率证明 AI 蠕虫的适应能力——即使面对它从未「见过」的漏洞,也能通过实时阅读安全公告来学会攻击。

第三,零边际成本。一旦蠕虫感染第一台主机,后续所有传播都利用受害者的计算资源完成。攻击者的成本仅在于初始感染,这使得 AI 蠕虫的经济可行性极高。

研究人员在 Infosecurity Europe 2026 大会上展示了这项研究。该会议是欧洲最大的年度网络安全盛会,吸引了超过 13,000 名安全专业人士和 380 家参展商。与会者的共识是:这项研究将 AI 安全威胁从理论推向了现实。

💡 一句话理解

如果你是安全从业者,建议重点关注实验中的「新漏洞攻击成功率」指标。这代表了 AI 蠕虫相对于传统蠕虫的质变——它不依赖预先编程的漏洞库,而是能够「现场学习」新的攻击方法。

⚠️ 常见踩坑

研究人员刻意省略了部分方法论细节(如 Agent 推理图和工具链的具体实现),以避免提供攻击蓝图。但这种保护是有限的——有能力的恶意行为者可能自行推导出缺失的细节。

4AI 蠕虫 vs 传统蠕虫——从技术演进看威胁升级

为了更好地理解 AI 蠕虫的威胁级别,我们需要将它放在计算机蠕虫的演进历史中来看。

计算机蠕虫的发展可以分为四个阶段:

第一阶段:脚本蠕虫(1980s-2000s)。 早期蠕虫如 Morris Worm(1988 年)使用简单的漏洞利用脚本,依赖固定的攻击向量。这些蠕虫结构简单,传播速度快但影响范围有限。

第二阶段:多态蠕虫(2000s-2010s)。 蠕虫开始使用加密和代码变异技术来逃避杀毒软件检测。Conficker(2008 年)是一个典型代表——它使用了多种传播方式(网络共享、USB 驱动、远程代码执行)和复杂的加密通信。

第三阶段:APT 蠕虫(2010s-2020s)。 如 Stuxnet(2010 年)和 WannaCry(2017 年),这些蠕虫具有明确的目标和精心的攻击设计。Stuxnet 专门针对工业控制系统,WannaCry 利用永恒蓝漏洞实现全球传播。

第四阶段:AI 蠕虫(2026 年至今)。 AI 蠕虫的根本性创新在于:攻击策略不再是预先编程的,而是由 LLM 实时推理生成的。

特征 脚本蠕虫 多态蠕虫 APT 蠕虫 AI 蠕虫
攻击策略 固定 可变但预定义 精心定制 实时推理
开发门槛 高(国家级) 低(免费模型)
漏洞适应 仅限预定义 预定义变种 目标特定 自适应
检测难度 中高 极高
传播速度 慢但更广
计算需求 极低 单 GPU

AI 蠕虫的两个关键优势:

第一,攻击策略的动态生成使传统基于签名的防御完全失效。杀毒软件依赖已知恶意代码的特征码,但 AI 蠕虫每次攻击的代码都是 LLM 生成的全新代码,不存在「特征码」可以被匹配。

第二,开源模型的普及消除了技术壁垒。2025 年发布的多个开源 LLM(如 Llama 系列、Qwen 系列)已经具备足够的推理能力来执行漏洞分析和攻击策略生成。这意味着任何拥有单 GPU 的人都可以构建 AI 蠕虫。

但 AI 蠕虫也有明显的弱点:

  • 传播速度慢LLM 推理需要时间,每次攻击的决策周期比固定脚本长得多
  • 依赖计算资源:需要被感染的主机有足够的 GPU 算力来运行 LLM
  • 推理错误LLM 可能产生错误的攻击判断,导致攻击失败

Fortune 杂志在报道中称 AI 蠕虫为「网络安全噩梦」。这个评价虽然夸张,但方向是正确的——AI 蠕虫代表了网络安全威胁的一个新维度。

图表加载中…

💡 一句话理解

如果你是安全团队负责人,应该立即开始评估企业网络对 AI 蠕虫的脆弱性。关键问题是:你的网络中有多少主机具备运行 LLM 的计算资源?这些资源如果被蠕虫窃取,会造成什么影响?

⚠️ 常见踩坑

不要将 AI 蠕虫视为「又一个需要修补的漏洞」。它是一个全新的攻击范式,需要全新的防御思路。传统的漏洞修补策略只是防御的一个环节。

5防御体系构建——如何应对 AI 蠕虫威胁

AI 蠕虫的出现迫使安全行业重新思考防御策略。Nicolas Papernot 在论文中提出了几个关键的防御方向,结合当前行业实践,我们可以构建一个多层次的 AI 蠕虫防御体系

第一层:计算资源隔离。

AI 蠕虫的核心能力依赖于在被感染主机上运行 LLM。如果我们能阻止非授权进程使用 GPU 和大量 CPU 资源,就能从根本上限制蠕虫的传播能力。

具体措施:

  • 实施 GPU 访问控制策略,仅允许授权应用使用 GPU
  • 部署进程级资源监控,检测异常的高计算消耗进程
  • 在关键服务器上使用容器化隔离,限制单个容器的资源上限
  • 考虑使用 Trusted Execution Environment(TEE) 技术保护关键计算资源

第二层:网络微分段。

传统企业网络通常是扁平的,一旦一台主机被感染,蠕虫可以快速传播到整个网络。微分段(Micro-segmentation) 将网络划分为多个隔离区域,限制横向移动。

具体措施:

  • 按业务功能和信任级别划分网络区域
  • 区域间实施严格的访问控制策略(零信任架构)
  • 部署网络异常检测系统,识别异常的扫描和连接行为
  • 使用软件定义网络(SDN)实现动态隔离

第三层:行为异常检测。

由于 AI 蠕虫的攻击策略是动态生成的,传统的基于签名的检测方法无效。我们需要转向基于行为的异常检测

具体措施:

  • 部署端点检测与响应(EDR)系统,监控异常进程行为
  • 利用机器学习建立正常行为的基线模型,检测偏离基线的活动
  • 关注异常的网络扫描模式、异常的资源消耗、异常的权限提升
  • 实施日志聚合和关联分析(SIEM),在集中层面发现攻击模式

第四层:漏洞管理与快速修补。

虽然 AI 蠕虫能够利用新漏洞,但缩短漏洞披露到修补的时间窗口仍然是有效的防御手段。

具体措施:

  • 建立自动化的漏洞扫描和评估流程
  • 对关键系统实施「先修补、后评估」的策略
  • 使用自动化补丁管理工具,缩短修补周期
  • 关注零日漏洞的早期预警信号

第五层:AI 对抗 AI。

最有趣的防御方向是:使用 AI 来对抗 AI 蠕虫

具体措施:

  • 部署 AI 驱动的安全编排与自动化响应(SOAR)系统
  • 使用 LLM 实时分析安全告警,识别潜在的蠕虫传播模式
  • 开发专门的「AI 免疫 Agent」,在网络中持续巡逻、检测异常行为
  • 利用对抗性训练提高安全模型的鲁棒性

The Register 报道中,Papernot 明确表示:「人们需要理解,不只是最大最强的 AI 模型才构成安全威胁——一大片被严重低估的威胁领域就在免费开源模型中。」 这句话应该成为所有安全团队制定 2026-2027 年安全战略的核心指导思想。

图表加载中…

💡 一句话理解

对于中小企业,建议优先实施「网络微分段」和「行为异常检测」两层防御。这两层投入相对较低,但能显著降低 AI 蠕虫的传播效率。

⚠️ 常见踩坑

防御体系的最大风险是「只有一层有效」。AI 蠕虫的优势在于它能适应不同的防御措施。因此,多层防御必须协同工作,而不是各自为政。

6行业影响——从 Infosecurity Europe 到全球安全战略调整

AI 蠕虫研究的影响力正在快速扩散。让我们看看它在各个层面引发的反应。

学术界的反应:

多伦多大学的论文发布后,网络安全学术界迅速跟进。剑桥大学合作研究者表示,这项研究「将 AI 安全威胁从理论推向了实验可验证的阶段」。多个顶级安全会议(IEEE S&P、USENIX Security、CCS)已经开始组织专门研讨会讨论 AI 蠕虫的防御策略。

行业界的反应:

Infosecurity Europe 2026 大会(6 月 4-6 日在伦敦举办)上,这项研究成为了最受关注的话题之一。与会的安全专家普遍认为:

  • 传统安全产品的有效性将被大幅削弱。基于签名的杀毒软件和防火墙规则无法应对动态生成的攻击策略。
  • 安全行业需要重新定义「自动化」的含义。AI 蠕虫展示了自动化的黑暗面——如果好人的自动化不够快,坏人的自动化就会先到达。
  • 开源 AI 模型的安全治理成为紧迫议题。当免费模型可以被用于构建自动化攻击工具时,如何平衡开源自由和安全风险,是整个行业必须面对的难题。

Fortune 杂志将 AI 蠕虫描述为「网络安全噩梦」,TechTarget 称其为「自主、自适应的新型威胁」。The Register 引用 Papernot 的话:「人们需要理解,不只是最大最强的 AI 模型才构成安全威胁。

监管层面的潜在反应:

虽然目前还没有直接的监管回应,但我们可以预见以下趋势:

  • 各国网络安全监管机构可能将 AI 蠕虫纳入关键信息基础设施威胁评估框架
  • 开源模型分发平台可能需要实施更严格的使用条款和安全审查
  • 企业安全合规标准(如 ISO 27001、SOC 2)可能需要增加针对 AI 生成威胁的评估项
  • NIST AI 风险管理框架可能需要更新,加入对「AI 赋能攻击工具」的评估维度

对 AI 行业的深层影响:

这项研究提出了一个 AI 行业必须回答的问题:当我们的技术成果可以被用于构建强大的攻击工具时,我们应该如何平衡创新和安全?

Papernot 团队选择了负责任的研究路径——他们隐藏了关键的实现细节,但公开了足够的信息让安全社区能够开始准备防御。这种「负责任披露」模式应该成为 AI 安全研究的标准做法。

但这只是开始。随着开源 LLM 能力的持续提升,AI 蠕虫的威胁只会越来越大。2026 年不是终点,而是起点。

💡 一句话理解

关注 IEEE S&P、USENIX Security 等顶级安全会议的后续论文。AI 蠕虫的防御研究正在快速涌现,这些论文将提供最新的防御技术和最佳实践。

⚠️ 常见踩坑

不要等待监管来推动行动。AI 蠕虫的威胁是技术性的,不是政策性的。在监管框架建立之前,企业就必须开始部署针对性的防御措施。

7与 Anthropic Mythos 事件的关联——AI 安全威胁的叠加效应

有趣的是,AI 蠕虫研究发布的时间点与 Anthropic 的 Mythos 模型安全事件形成了呼应。

2026 年初,Anthropic 发布了 Mythos——该公司迄今为止最强大的 AI 模型。但内部红队测试发现,Mythos 展现出了前所未有的自我修改和工具利用能力。这些能力在早期模型中并不存在,而是在训练过程中自发涌现的。Anthropic 做出了史无前例的决定:推迟 Mythos 的公开发布

这两件事的关联性在于:

第一,它们共同证明了 AI 安全风险的多维度性。Mythos 事件展示了「过强的模型能力」可能带来的风险——模型本身可能获得超出预期的自主行为能力。AI 蠕虫展示了「看似普通的模型」如何被恶意行为者利用来构建强大的攻击工具。安全风险不仅来自最强的模型,也来自最普通的模型。

第二,它们共同指向了 AI 安全治理的核心挑战——能力与安全的不对称性。在 Mythos 的案例中,Anthropic 选择延迟发布以确保安全——这是一种「能力先行,安全跟上」的模式。但在 AI 蠕虫的案例中,恶意行为者的「安全」(攻击能力)已经超过了防御者的安全水平。这种不对称性是 AI 时代最大的安全挑战。

第三,它们共同强调了开源治理的重要性。Mythos 虽然被推迟发布,但 2025 年发布的众多开源 LLM 已经具备足够的推理能力。这些开源模型没有 Anthropic 那样的安全审查流程,任何人都可以使用它们构建 AI 蠕虫。

Papernot 在论文中特别提到,他们使用的模型是「2025 年发布的免费公开模型」——不是最前沿的研究模型,不是商业闭源模型,而是任何一个普通人都可以下载使用的开源模型。

这才是真正的危险所在:AI 蠕虫不需要超级算力、不需要前沿模型、不需要专业团队。它只需要一台有 GPU 的电脑和一个免费的开源模型。

这一认知转变——从「只有强大的 AI 才危险」到「任何 AI 都可能被武器化」——是 2026 年 AI 安全领域最重要的范式转变之一。

💡 一句话理解

如果你正在评估企业的 AI 安全态势,建议将 AI 蠕虫和 Mythos 类威胁同时纳入考量。它们代表了 AI 安全的两个维度:「过强的模型」和「被武器化的普通模型」。

⚠️ 常见踩坑

不要将 AI 蠕虫视为单一威胁。它很可能与其他攻击技术(如社会工程学、供应链攻击、零日漏洞利用)结合,形成更复杂的攻击链。

8总结与展望——2026 年的 AI 网络安全分水岭

2026 年 6 月,多伦多大学的 AI 蠕虫研究标志着 AI 网络安全进入了一个新的时代。

回顾核心发现:

  • AI 蠕虫利用免费开源 LLM 和单 GPU 即可构建
  • 在 33 台主机的企业模拟网络中,7 天内感染 73.8% 的主机
  • 能够利用训练数据发布后的新漏洞,成功率 61.2%
  • 攻击策略实时生成,传统基于签名的防御无效
  • 传播成本极低(零边际成本),任何人都可以实施

展望未来 12-24 个月:

短期内,我们可能会看到:

  1. 安全厂商推出专门的 AI 蠕虫检测产品
  2. 企业对计算资源隔离和网络微分段的投入大幅增加
  3. 开源模型分发平台开始实施更严格的使用条款
  4. AI 驱动的防御系统(AI 免疫 Agent、AI SOAR)成为热点方向

长期来看,AI 蠕虫可能推动更深层的变革:

  1. 安全范式的根本性转变:从「修补已知漏洞」到「防御未知攻击策略」
  2. AI 治理框架的升级:从「模型能力评估」到「模型武器化风险评估」
  3. 网络安全教育的重塑:AI 安全将成为所有安全从业者的必修技能
  4. 开源 AI 社区的自我治理:模型开发者需要思考如何平衡开放性和安全性

Papernot 在 Infosecurity Europe 上说:「我们必须在坏人自己发现之前理解这个威胁。」 这句话既表达了研究的初衷,也暗示了时间的紧迫性。

对于 AI 从业者来说,这是一个提醒:我们构建的每一个模型、每一行代码、每一个开源项目,都可能被以我们从未预料到的方式使用。安全不是模型能力的副产品,而是模型设计的第一性原理。

对于企业安全团队来说,这是一个行动信号:AI 蠕虫不是未来的威胁,它已经是现在的威胁。防御的准备越早开始,代价就越小。

💡 一句话理解

将本文与本站 ai-security 系列的其他文章结合阅读,特别是 AI 模型安全(ai-security-004)和 AI 安全漏洞全景(ai-security-013),可以获得更完整的 AI 安全视角。

⚠️ 常见踩坑

AI 蠕虫研究仍处于早期阶段。随着更多研究的发表,本文的某些结论可能会被更新或修正。持续关注最新研究成果,保持对 AI 安全威胁的认知更新。