Cloudflare 的 Mythos 实战测试
2026年5月18日,Cloudflare 官方博客发布。
测试概要
- 测试范围:50+ Cloudflare 自有代码仓库
- 测试目标:评估 Mythos Preview 发现安全漏洞的能力
- 评估维度:模型表现、架构设计、规模化应用潜力
核心发现
Cloudflare 的测试团队发现,Mythos Preview 在识别某些类型的安全漏洞方面表现出色,但也暴露出了规模化应用中的架构和流程问题。报告建议需要对安全 LLM 的使用方式进行系统性改进,才能真正将其集成到大规模安全审计流程中。
行业意义
这是首批由大型科技公司发布的针对 Frontier AI 安全模型的真实世界测试报告,为 Anthropic Mythos 的实际应用价值提供了重要参考。
来源: Cloudflare Blog
链接: https://blog.cloudflare.com/cyber-frontier-models/