安全3 天前·Bloomberg
Anthropic指控阿里巴巴发起最大规模AI模型蒸馏攻击
Anthropic致信美国参议院,指控阿里巴巴Qwen实验室在4月22日至6月5日期间使用约2.5万个虚假账户与Claude模型进行2880万次交互,通过蒸馏技术复制Claude的软件工程与Agent推理能力。Anthropic此前已发现DeepSeek、Moonshot、MiniMax三家中国AI实验室的工业级蒸馏活动。
AI Master 解读
核心事件
Anthropic指控阿里巴巴发起已知最大规模的AI模型蒸馏攻击。
行业影响
影响分析: 蒸馏攻击正成为前沿模型面临的主要安全威胁之一。通过大规模调用目标模型并收集输出,竞争对手可以低成本复制模型能力。这一现象暴露了当前AI产业在知识产权保护、模型安全防护方面的短板。
AI Master 建议
关注模型服务商的反蒸馏技术(如输出检测、访问频率限制、水印技术),以及中美AI竞争从技术追赶转向知识产权博弈的新趋势。
Anthropic指控阿里巴巴发起最大规模AI模型蒸馏攻击
2026年6月24日,Anthropic向美国参议院银行、住房和城市事务委员会发送信件,指控阿里巴巴及其Qwen AI实验室发起针对Claude模型的【最大已知蒸馏攻击】。
事件细节
根据Anthropic披露(信件已获CNBC查阅):
- 时间跨度: 2026年4月22日至6月5日(约45天)
- 攻击规模: 约2.5万个虚假账户,2880万次模型交互
- 目标: 收集Claude输出用于训练Qwen模型
- 性质: Anthropic称其【公然】且【非法】违反服务条款
蒸馏攻击的技术原理
蒸馏(Distillation)是一种模型压缩技术,通过让小型模型(学生模型)学习大型模型(教师模型)的输出来提升性能。当竞争对手系统性地调用前沿模型并收集响应时,就构成了【蒸馏攻击】。
问题在于:
- 堆叠蒸馏会累积错误和幻觉
- 如果1%的输出包含幻觉,下游模型训练会继承并放大这些错误
- 形成【错误级联】效应
更广泛的背景
Anthropic在2月已披露发现三家中国AI实验室的工业级蒸馏活动:
- DeepSeek
- Moonshot(月之暗面)
- MiniMax
Anthropic表示这些攻击【变得越来越复杂和激烈】。
政治与商业影响
- 特朗普政府对Anthropic的Fable和Mythos模型实施管控
- Anthropic正与政府协商解除限制方案
- 中国AI模型在美国市场快速扩张,引发国家安全担忧
- 华盛顿可能出台新的制裁措施