大语言模型2 天前·Hacker News + TechCrunch

网络安全研究者批评 Anthropic Fable 安全防护限制过严

Anthropic 发布 Claude Fable 5 后，多位网络安全研究者公开批评其安全防护过于严格，限制了模型的安全研究价值。Fable 作为 Mythos 级模型，本被视为安全研究领域的重要工具，但 Anthropic 添加了多层使用限制。

AI Master 解读

核心事件

行业影响

Fable 是 Anthropic 首个公开发布的 Mythos 级模型，在网络安全领域能力极强。但 Anthropic 对 Fable 施加了严格的使用护栏，引发了安全社区的不满。这反映了 AI 公司在模型能力开放与安全管控之间的持续矛盾。

AI Master 建议

关注 Anthropic 对 Fable 安全护栏的调整动向，评估对安全研究社区的影响。

Anthropic 于近日发布 Claude Fable 5，这是其首个公开可用的 Mythos 级模型。然而，安全研究者对 Fable 的安全防护措施提出了强烈批评。

来源: Hacker News + TechCrunch
链接: https://techcrunch.com/2026/06/10/cybersecurity-researchers-arent-happy-about-the-guardrails-on-anthropics-fable/

📰 原始来源

← 上一篇

Anthropic 要求 Fable 和 Mythos 模型用户强制 30 天数据保留

Rich Sutton 谈 AI 创造力与发现：强化学习之父的最新观点