大模型的网络安全能力正在被系统性评估。
评估结果
英国 AI 安全研究所(AISI)发布了对 GPT-5.5 网络安全能力的评估报告。结果显示,GPT-5.5 在发现和利用安全漏洞方面的能力与此前评估的 Claude Mythos 相当。
关键差异
与 Mythos 不同,GPT-5.5 是已经全面可用(generally available)的模型。这意味着强大的网络安全能力不再是实验室中的研究项目,而是已经部署到生产环境中的现实能力。
行业意义
AISI 此前评估过 Claude Mythos 的网络能力,此次评估 GPT-5.5 表明各国安全机构正在密切关注前沿 AI 模型的网络安全影响。
来源: Simon Willison's Weblog + UK AISI
链接: https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities/