安全今天·Mashable + WaveSpeed AI

Anthropic 计划公开 Claude Mythos 模型,安全护栏开发成关键门槛

Anthropic 更新 Project Glasswing 公告,计划先向美国及盟国政府开放 Mythos 访问权限,随后在「不久的将来」推出面向公众的版本。安全护栏尚未就位是主要障碍。

Claude Mythos 的公开路线图首次明朗化。

背景回顾:

  • Mythos 于 4 月 7 日通过 Project Glasswing 向约 50 家合作组织(AWS、Apple、Google、Microsoft、NVIDIA 等)提供
  • 仅限防御性网络安全工作使用
  • 首月报告:在 1000+ 开源项目中发现 23019 个漏洞,90.6% 经独立采样确认真实

公开计划:

  • 第一步:扩展至美国和盟国政府
  • 第二步:在「不久的将来」面向更广泛的公众发布
  • 关键前提:需要开发足够的安全护栏,Anthropic 自认「目前尚不存在」

争议与挑战:

  • Mythos 强大的漏洞发现能力引发双重用途担忧
  • 有 Discord 群组声称通过猜测访问路径获得了 Mythos 访问权限
  • 联邦政府曾因 Mythos 召集金融领袖召开紧急会议

来源: Mashable
链接: https://mashable.com/tech/anthropic-mythos-might-get-public-release