安全3 天前·Bloomberg

Anthropic指控阿里巴巴发起最大规模AI模型蒸馏攻击

Anthropic致信美国参议院,指控阿里巴巴Qwen实验室在4月22日至6月5日期间使用约2.5万个虚假账户与Claude模型进行2880万次交互,通过蒸馏技术复制Claude的软件工程与Agent推理能力。Anthropic此前已发现DeepSeek、Moonshot、MiniMax三家中国AI实验室的工业级蒸馏活动。

AI Master 解读

核心事件

Anthropic指控阿里巴巴发起已知最大规模的AI模型蒸馏攻击。

行业影响

影响分析: 蒸馏攻击正成为前沿模型面临的主要安全威胁之一。通过大规模调用目标模型并收集输出,竞争对手可以低成本复制模型能力。这一现象暴露了当前AI产业在知识产权保护、模型安全防护方面的短板。

AI Master 建议

关注模型服务商的反蒸馏技术(如输出检测、访问频率限制、水印技术),以及中美AI竞争从技术追赶转向知识产权博弈的新趋势。

Anthropic指控阿里巴巴发起最大规模AI模型蒸馏攻击

2026年6月24日,Anthropic向美国参议院银行、住房和城市事务委员会发送信件,指控阿里巴巴及其Qwen AI实验室发起针对Claude模型的【最大已知蒸馏攻击】。

事件细节

根据Anthropic披露(信件已获CNBC查阅):

  • 时间跨度: 2026年4月22日至6月5日(约45天)
  • 攻击规模: 约2.5万个虚假账户,2880万次模型交互
  • 目标: 收集Claude输出用于训练Qwen模型
  • 性质: Anthropic称其【公然】且【非法】违反服务条款

蒸馏攻击的技术原理

蒸馏(Distillation)是一种模型压缩技术,通过让小型模型(学生模型)学习大型模型(教师模型)的输出来提升性能。当竞争对手系统性地调用前沿模型并收集响应时,就构成了【蒸馏攻击】。

问题在于:

  • 堆叠蒸馏会累积错误和幻觉
  • 如果1%的输出包含幻觉,下游模型训练会继承并放大这些错误
  • 形成【错误级联】效应

更广泛的背景

Anthropic在2月已披露发现三家中国AI实验室的工业级蒸馏活动:

  1. DeepSeek
  2. Moonshot(月之暗面)
  3. MiniMax

Anthropic表示这些攻击【变得越来越复杂和激烈】。

政治与商业影响

  • 特朗普政府对Anthropic的Fable和Mythos模型实施管控
  • Anthropic正与政府协商解除限制方案
  • 中国AI模型在美国市场快速扩张,引发国家安全担忧
  • 华盛顿可能出台新的制裁措施