GPT-5.5 网络能力评估
2026 年 4 月 30 日,英国 AI 安全研究所(AISI)发布了对 GPT-5.5 网络安全能力的详细评估报告。
核心发现
- 漏洞发现能力:GPT-5.5 在发现安全漏洞方面的表现与 Claude Mythos 相当
- 关键区别:Mythos 仍受限访问,而 GPT-5.5 已全面开放使用
- 评估方法:标准化的网络安全基准测试,覆盖多种漏洞类型
行业影响
这是 AISI 继评估 Claude Mythos 之后对 GPT-5.5 的又一次重要评估。两份报告的对比表明,前沿模型在网络攻防能力上已经非常接近,但开放访问的模型可能带来更大的安全风险。
Simon Willison 评论
Simon Willison 引用该报告指出,AISI 的评估为监管机构提供了重要的参考依据,帮助理解前沿模型在网络领域的实际能力边界。
来源: UK AISI + Simon Willison's Weblog
链接: https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities