OpenAI 发布 GPT-5.3-Codex

AI资讯 20小时前 硕雀
7 0

GPT-5.3-Codex 是 OpenAI 在 2026 年 2 月发布的最新一代 代码专用 AI 代理模型AI Agent)。它不仅是一个“代码助手”,更被定位为具备 自主工程能力(Autonomous Engineering)‍ 的智能体(Intelligent Agent)。

  • 从“助手”到“代理”‍:相较于前代模型(如 GPT-5.2-Codex),GPT-5.3-Codex 实现了从“提供代码建议”向“自动执行复杂开发任务”的转变。这意味着它不仅能生成代码,还能独立运行终端命令、调试程序,甚至参与自身的部署和调试过程。
  • 自我参与训练:OpenAI 公开表示,GPT-5.3-Codex 的早期版本参与了自身的训练调试、部署管理和测试评估。OpenAI 称其为“首个在自身创建过程中发挥关键作用的模型”。

2. 关键特性与技术创新

GPT-5.3-Codex 在性能、速度和安全性方面均有显著升级:

  • 性能与速度
    • 响应速度提升:单 token 处理速度提升超过 25%,运行速度更快。
    • Token 效率革命:完成同等任务所需的 token 数量相比 5.2-Codex 减少了 超过一半
    • 长时间任务支持:支持研究、工具使用和复杂执行等需要长时间运行的任务,并允许用户在执行过程中进行实时交互调整。
  • 指令遵循与实时交互
    • “指导”功能:引入了“指导”功能,开发者可以在任务执行中实时介入,调整模型的执行方向,而不会导致模型丢失上下文。
    • 多语言工程能力:在跨语言编程和跨环境任务(如容器、虚拟机管理)上表现更强。
  • 安全性与伦理
    • 网络安全模型:这是 OpenAI 在 Preparedness Framework 下第一个被标为 High capability(高能力)‍ 的网络安全模型。它是首个直接训练来识别软件漏洞的模型,具备了更完善的安全栈和威胁情报系统。
    • 安全措施:OpenAI 对其部署了迄今为止最全面的安全监控系统,确保其不会被用于端到端的自动化网络攻击。

3. 基准测试表现

在多个权威的编程基准测试中,GPT-5.3-Codex 均创下了新纪录,性能接近人类专家水平:

  • SWE-bench Pro (Public)准确率达 56.8%
  • Terminal-Bench 2.0:分数从 64.0% 提升至 77.3%,显著领先于竞争对手 Claude Opus 4.6。
  • OSWorld-Verified:得分 64.7%,接近人类水平。
  • 其他表现:在多项权威基准测试中均取得领先成绩。

4. 核心架构与平台生态

  • 硬件部署:训练与部署主要基于 NVIDIA GB200 NVL72 系统,专为高性能推理和大规模计算优化。
  • 企业级平台(OpenAI Frontier)‍:OpenAI 同时推出了名为 OpenAI Frontier 的 AI Agent 平台。企业用户(如惠普、Uber)可利用该平台构建、部署和管理专属的智能体,以实现规模化使用。

5. 使用场景与应用案例

GPT-5.3-Codex 旨在解决专业软件开发中的复杂需求,适用范围广泛:

  • 大型代码库管理:能够一次性分析百万行级代码库,识别架构问题、技术债务,并自动生成代码地图和依赖关系图
  • 系统级开发:支持内核模块、驱动程序开发,理解硬件交互和底层协议,优化系统性能。
  • 网络安全开发:生成安全代码模板,模拟渗透测试,发现系统弱点并提供防御方案。
  • 企业级智能体:通过 Frontier 平台,企业可以部署专属的编程智能体,提升研发效率。

6. 发布与开放策略

  • 发布时间:2026 年 2 月 5 日/6 日(各大平台报道时间略有差异)。
  • 生态集成:已率先在 Cursor代码编辑器)、GitHub 和 VS Code 中部署使用。
  • 访问方式:最初通过付费 ChatGPT 计划(ChatGPT Plus)提供访问,API 将分阶段逐步开放给开发者和企业客户。
来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!