大语言模型2 天前·Hacker News + TechCrunch

网络安全研究者批评 Anthropic Fable 安全防护限制过严

Anthropic 发布 Claude Fable 5 后,多位网络安全研究者公开批评其安全防护过于严格,限制了模型的安全研究价值。Fable 作为 Mythos 级模型,本被视为安全研究领域的重要工具,但 Anthropic 添加了多层使用限制。

AI Master 解读

核心事件

网络安全研究者批评 Anthropic Fable 安全防护限制过严

行业影响

Fable 是 Anthropic 首个公开发布的 Mythos 级模型,在网络安全领域能力极强。但 Anthropic 对 Fable 施加了严格的使用护栏,引发了安全社区的不满。这反映了 AI 公司在模型能力开放与安全管控之间的持续矛盾。

AI Master 建议

关注 Anthropic 对 Fable 安全护栏的调整动向,评估对安全研究社区的影响。

Fable 安全护栏引发争议

Anthropic 于近日发布 Claude Fable 5,这是其首个公开可用的 Mythos 级模型。然而,安全研究者对 Fable 的安全防护措施提出了强烈批评。

核心争议

  • Fable 在网络安全领域能力极强,可发现数千个此前未知的漏洞
  • 但 Anthropic 对 Fable 施加了严格的使用限制和护栏
  • 多位安全研究者认为这些限制削弱了 Fable 的安全研究价值
  • Anthropic 此前曾称 Mythos 级模型过于危险而不宜公开发布

行业背景

  • Anthropic 要求 Fable 和 Mythos 用户遵守 30 天数据保留政策
  • Microsoft AI 负责人 Mustafa Suleyman 公开批评 Anthropic 对 Claude 意识的猜测"非常危险"
  • 安全行业对 Mythos 级模型的开放路径存在分歧

来源: Hacker News + TechCrunch
链接: https://techcrunch.com/2026/06/10/cybersecurity-researchers-arent-happy-about-the-guardrails-on-anthropics-fable/