大语言模型2026-05-02 00:00·Simon Willison's Weblog + UK AISI

英国 AISI 评估 GPT-5.5 网络安全能力,与 Claude Mythos 相当

英国 AI 安全研究所评估 GPT-5.5 的网络漏洞发现能力,结果与 Claude Mythos 相当,但 GPT-5.5 已全面可用。

大模型的网络安全能力正在被系统性评估。

评估结果

英国 AI 安全研究所(AISI)发布了对 GPT-5.5 网络安全能力的评估报告。结果显示,GPT-5.5 在发现和利用安全漏洞方面的能力与此前评估的 Claude Mythos 相当。

关键差异

与 Mythos 不同,GPT-5.5 是已经全面可用(generally available)的模型。这意味着强大的网络安全能力不再是实验室中的研究项目,而是已经部署到生产环境中的现实能力。

行业意义

AISI 此前评估过 Claude Mythos 的网络能力,此次评估 GPT-5.5 表明各国安全机构正在密切关注前沿 AI 模型的网络安全影响。

来源: Simon Willison's Weblog + UK AISI
链接: https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities/