OpenAI 发布 GPT-5.3-Codex

AI资讯 20小时前硕雀

7 0 0

GPT-5.3-Codex 是 OpenAI 在 2026 年 2 月发布的最新一代 代码专用 AI 代理模型（AI Agent）。它不仅是一个“代码助手”，更被定位为具备 自主工程能力（Autonomous Engineering）‍ 的智能体（Intelligent Agent）。

从“助手”到“代理”‍：相较于前代模型（如 GPT-5.2-Codex），GPT-5.3-Codex 实现了从“提供代码建议”向“自动执行复杂开发任务”的转变。这意味着它不仅能生成代码，还能独立运行终端命令、调试程序，甚至参与自身的部署和调试过程。
自我参与训练：OpenAI 公开表示，GPT-5.3-Codex 的早期版本参与了自身的训练调试、部署管理和测试评估。OpenAI 称其为“首个在自身创建过程中发挥关键作用的模型”。

2. 关键特性与技术创新

GPT-5.3-Codex 在性能、速度和安全性方面均有显著升级：

性能与速度
- 响应速度提升：单 token 处理速度提升超过 25%，运行速度更快。
- Token 效率革命：完成同等任务所需的 token 数量相比 5.2-Codex 减少了 超过一半。
- 长时间任务支持：支持研究、工具使用和复杂执行等需要长时间运行的任务，并允许用户在执行过程中进行实时交互调整。
指令遵循与实时交互
- ‍“指导”功能：引入了“指导”功能，开发者可以在任务执行中实时介入，调整模型的执行方向，而不会导致模型丢失上下文。
- 多语言工程能力：在跨语言编程和跨环境任务（如容器、虚拟机管理）上表现更强。
安全性与伦理
- 网络安全模型：这是 OpenAI 在 Preparedness Framework 下第一个被标为 High capability（高能力）‍ 的网络安全模型。它是首个直接训练来识别软件漏洞的模型，具备了更完善的安全栈和威胁情报系统。
- 安全措施：OpenAI 对其部署了迄今为止最全面的安全监控系统，确保其不会被用于端到端的自动化网络攻击。

3. 基准测试表现

在多个权威的编程基准测试中，GPT-5.3-Codex 均创下了新纪录，性能接近人类专家水平：

SWE-bench Pro (Public)：准确率达 56.8%。
Terminal-Bench 2.0：分数从 64.0% 提升至 77.3%，显著领先于竞争对手 Claude Opus 4.6。
OSWorld-Verified：得分 64.7%，接近人类水平。
其他表现：在多项权威基准测试中均取得领先成绩。

4. 核心架构与平台生态

硬件部署：训练与部署主要基于 NVIDIA GB200 NVL72 系统，专为高性能推理和大规模计算优化。
企业级平台（OpenAI Frontier）‍：OpenAI 同时推出了名为 OpenAI Frontier 的 AI Agent 平台。企业用户（如惠普、Uber）可利用该平台构建、部署和管理专属的智能体，以实现规模化使用。

5. 使用场景与应用案例

GPT-5.3-Codex 旨在解决专业软件开发中的复杂需求，适用范围广泛：

大型代码库管理：能够一次性分析百万行级代码库，识别架构问题、技术债务，并自动生成代码地图和依赖关系图。
系统级开发：支持内核模块、驱动程序开发，理解硬件交互和底层协议，优化系统性能。
网络安全开发：生成安全代码模板，模拟渗透测试，发现系统弱点并提供防御方案。
企业级智能体：通过 Frontier 平台，企业可以部署专属的编程智能体，提升研发效率。

6. 发布与开放策略

发布时间：2026 年 2 月 5 日/6 日（各大平台报道时间略有差异）。
生态集成：已率先在 Cursor（代码编辑器）、GitHub 和 VS Code 中部署使用。
访问方式：最初通过付费 ChatGPT 计划（ChatGPT Plus）提供访问，API 将分阶段逐步开放给开发者和企业客户。

GPT-5.3-Codex

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！