大语言模型2 天前·Hacker News + TechCrunch
网络安全研究者批评 Anthropic Fable 安全防护限制过严
Anthropic 发布 Claude Fable 5 后,多位网络安全研究者公开批评其安全防护过于严格,限制了模型的安全研究价值。Fable 作为 Mythos 级模型,本被视为安全研究领域的重要工具,但 Anthropic 添加了多层使用限制。
AI Master 解读
核心事件
网络安全研究者批评 Anthropic Fable 安全防护限制过严
行业影响
Fable 是 Anthropic 首个公开发布的 Mythos 级模型,在网络安全领域能力极强。但 Anthropic 对 Fable 施加了严格的使用护栏,引发了安全社区的不满。这反映了 AI 公司在模型能力开放与安全管控之间的持续矛盾。
AI Master 建议
关注 Anthropic 对 Fable 安全护栏的调整动向,评估对安全研究社区的影响。
Fable 安全护栏引发争议
Anthropic 于近日发布 Claude Fable 5,这是其首个公开可用的 Mythos 级模型。然而,安全研究者对 Fable 的安全防护措施提出了强烈批评。
核心争议
- Fable 在网络安全领域能力极强,可发现数千个此前未知的漏洞
- 但 Anthropic 对 Fable 施加了严格的使用限制和护栏
- 多位安全研究者认为这些限制削弱了 Fable 的安全研究价值
- Anthropic 此前曾称 Mythos 级模型过于危险而不宜公开发布
行业背景
- Anthropic 要求 Fable 和 Mythos 用户遵守 30 天数据保留政策
- Microsoft AI 负责人 Mustafa Suleyman 公开批评 Anthropic 对 Claude 意识的猜测"非常危险"
- 安全行业对 Mythos 级模型的开放路径存在分歧
来源: Hacker News + TechCrunch
链接: https://techcrunch.com/2026/06/10/cybersecurity-researchers-arent-happy-about-the-guardrails-on-anthropics-fable/