行业3 天前·CNBC

Anthropic指控阿里巴巴发起最大规模AI模型蒸馏攻击

Anthropic致信美国参议院银行委员会,指控阿里巴巴及其Qwen AI实验室在4月22日至6月5日期间使用约2.5万个虚假账户与Claude模型进行2880万次交互,通过蒸馏技术训练Qwen模型。Anthropic此前已发现DeepSeek、Moonshot、MiniMax三家中国AI实验室的工业级蒸馏活动。该事件引发知识产权、国家安全和AI竞争格局的广泛讨论。

AI Master 解读

核心事件

Anthropic指控阿里巴巴发起已知最大规模的AI模型蒸馏攻击。

行业影响

影响分析: 蒸馏攻击正成为前沿模型面临的主要安全威胁之一。通过大规模调用目标模型并收集输出,竞争对手可以低成本复制模型能力。这一现象暴露了当前AI产业在知识产权保护、模型安全防护方面的短板。

AI Master 建议

关注模型服务商的反蒸馏技术(如输出检测、访问频率限制、水印技术),以及中美AI竞争从技术追赶转向知识产权博弈的新趋势。

Anthropic指控阿里巴巴发起最大规模AI模型蒸馏攻击

2026年6月24日,Anthropic向美国参议院银行、住房和城市事务委员会发送信件,指控阿里巴巴及其Qwen AI实验室发起针对Claude模型的【最大已知蒸馏攻击】。

事件细节

根据Anthropic披露(信件已获CNBC查阅):

  • 时间跨度: 2026年4月22日至6月5日(约45天)
  • 攻击规模: 约2.5万个虚假账户,2880万次模型交互
  • 目标: 收集Claude输出用于训练Qwen模型
  • 性质: Anthropic称其【公然】且【非法】违反服务条款

蒸馏攻击的技术原理

蒸馏(Distillation)是一种模型压缩技术,通过让小型模型(学生模型)学习大型模型(教师模型)的输出来提升性能。当竞争对手系统性地调用前沿模型并收集响应时,就构成了【蒸馏攻击】。

问题在于:

  • 堆叠蒸馏会累积错误和幻觉
  • 如果1%的输出包含幻觉,下游模型训练会继承并放大这些错误
  • 形成【错误级联】效应

更广泛的背景

Anthropic在2月已披露发现三家中国AI实验室的工业级蒸馏活动:

  1. DeepSeek
  2. Moonshot(月之暗面)
  3. MiniMax

Anthropic表示这些攻击【变得越来越复杂和激烈】。

政治与商业影响

  • 特朗普政府对Anthropic的Fable和Mythos模型实施管控
  • Anthropic正与政府协商解除限制方案
  • 中国AI模型在美国市场快速扩张,引发国家安全担忧
  • 华盛顿可能出台新的制裁措施

行业反应

这一指控反映了AI竞争从【技术追赶】转向【知识产权博弈】的新阶段。前沿模型厂商需要:

  • 加强反蒸馏技术(输出检测、访问频率限制、水印)
  • 建立更严格的服务条款执行机制
  • 推动国际AI知识产权保护框架