OpenAI 公开了其内部部署 Codex 的完整安全方案。
安全架构
- 沙箱隔离:定义 Codex 可写入的路径、网络访问权限和受保护目录
- 自动审批模式:低风险操作自动放行,高风险操作暂停等待人工审批
- 网络策略:允许的域名列表 + 阻断列表 + 陌生域名需审批,不给 Codex 开放式出站访问
- OAuth 凭据管理:CLI 和 MCP 凭证存储在安全 OS 钥匙串,登录强制通过 ChatGPT
- 命令分级:常见无害命令无需审批,危险命令需审批或直接阻止
Agent 遥测
Codex 支持 OpenTelemetry 日志导出,覆盖用户提示、工具审批决策、工具执行结果、MCP 服务器使用和网络代理允许/拒绝事件。OpenAI 使用这些日志配合 AI 安全分类 Agent,区分预期 Agent 行为、良性错误和需要升级的活动。
行业意义
随着编码 Agent 深度集成到开发工作流中,安全团队需要专门为此类工具设计的管理表面。Codex 提供的控制面、配置管理、沙箱和 Agent 感知遥测,为安全团队在赋能开发者的同时保持可见性和控制力提供了范本。
来源: OpenAI Blog
链接: https://openai.com/index/running-codex-safely/