OpenAI 于 2025 年 12 月 11 日正式发布了最新的大语言模型 GPT‑5.2,并在同日向 ChatGPT Plus/Pro/Business/Enterprise 用户以及开发者开放 API 调用。本次发布的 GPT‑5.2 采用“三档”模型结构,分别针对不同使用场景进行优化,主要包括 Instant、Thinking、Pro 三个版本。
1. 三个版本的定位与特点
| 版本 | 主要定位 | 关键优势 |
|---|---|---|
| Instant | 日常学习、工作助手 | 响应速度快,保持 GPT‑5.1 的亲切对话风格,信息检索、技术写作、翻译等任务的准确性和流畅度均有提升 |
| Thinking | 专业知识工作、深度推理 | 长上下文理解显著增强,表格创建、分析、格式化能力提升,能够直接生成 PPT、Excel 等商务文档,错误率比前代降低约 38% |
| Pro | 高难度科研、复杂编程 | 在编程、数学、科学任务上的表现最强,适合辅助和加速科研工作,可靠性最高 |
2. 关键技术改进
- 长上下文能力:最大输入 token 可达 256k,Thinking 版在长文本推理中的匹配率远超 GPT‑5.1,保持在 80% 以上。
- 多模态与视觉:在视觉理解、图像生成等方面实现显著提升,支持更精准的图像描述与分析。
- 表格与幻灯片生成:新增对 Excel 表格的创建、编辑以及 PPT 幻灯片的自动生成能力,帮助用户快速完成商务报告。
- 知识截止日期:模型的知识库更新至 2025 年 8 月,能够提供更接近实时的世界信息。
3. 训练与合作背景
GPT‑5.2 由 OpenAI 与 NVIDIA、微软等合作伙伴共同研发,训练使用了 Azure 数据中心配备的 H100/H200 系列高性能 GPU。发布后,OpenAI 表示将继续围绕“过度拒绝、响应延迟”等已知问题进行迭代优化。
4. 定价与使用方式
- 输入 token 费用约 1.75 美元/百万,输出 token 费用约 14 美元/百万,相较前代模型整体使用成本更低。
- 初期仅对付费用户开放,免费和 Go 计划用户将在次日获得访问权限。
- 开发者可通过 API 调用对应的模型名称:
gpt-5.2(Thinking)、gpt-5.2-chat-latest(Instant)以及gpt-5.2-pro(Pro)。
5. 市场与竞争格局
GPT‑5.2 的发布被视为 OpenAI 对谷歌 Gemini 3 的直接回击,旨在巩固其在企业级 AI 市场的领先地位,并通过提升表格、演示文稿、代码等生产力工具的能力,创造更高的经济价值。
6. 未来展望
OpenAI 表示,GPT‑5.2 只是持续迭代系列的一部分,后续将继续在“过度拒绝、响应延迟”等方面进行优化,并计划在明年推出更强大的图像生成模型以及其他新功能。
综上所述,GPT‑5.2 是 OpenAI 在 2025 年底推出的最新一代大语言模型,提供三档版本以满足从快速查询到深度专业推理的不同需求,在长上下文、多模态、表格与幻灯片生成等方面实现显著提升,并已向付费用户和开发者开放使用。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!