OpenAI 下一代图像生成模型疑似现身,已在 Design Arena 与 LM Arena 开启盲测

AI资讯 16小时前 硕雀
2 0

OpenAI 下一代图像生成模型概览


1. 背景与出现时间

  • 2025 年 12 月 10 日,IT之家等媒体披露,OpenAI 正在内部盲测两款代号为 ‍“Hazelnut(榛子)”‍ 与 ‍“Chestnut(栗子)”‍ 的全新图像生成模型。
  • 这两款模型在过去 24 小时内频繁出现在 Design Arena 与 LM Arena 两大模型竞技场中,暗示它们已进入公开测试阶段。

2. 测试平台简介

平台 主要功能 与 OpenAI 的关联
Design Arena 侧重视觉生成模型的对比评测,提供盲测投票与评分系统,帮助研发团队快速获取用户反馈。 Hazelnut、Chestnut 在该平台提交生成样例,接受社区盲测。
LM Arena 以“语言模型竞技场”形式呈现,用户在不知模型身份的情况下对比不同模型的输出质量。 两款图像模型同样以盲测方式参与,评估其在文本‑图像协同任务中的表现。

3. 技术亮点

  1. 文本/代码渲染能力提升
    • 与以往模型在图中出现文字或代码时常出现乱码不同,Hazelnut/Chestnut 能在图像中呈现清晰、准确的代码文本。
  2. 世界知识与语义理解增强
    • 初步盲测显示,这两款模型在通用场景的语义理解上已能与 Google 的 Nano Banana Pro 相抗衡,表现出更强的常识推理能力。
  3. 底层架构猜测
    • 虽未公开正式技术细节,但业内推测它们基于 GPT‑4o 的多模态架构,而非直接在 gpt‑image‑1 上迭代,意味着 OpenAI 正在探索不同技术路径来提升图像生成质量。
  4. 与 GPT‑5.2 的潜在关联
    • 有消息称,这两款模型可能作为即将发布的 GPT‑5.2(传闻中的大模型升级版)的伴生产品同步推出,进一步强化 OpenAI 在文本‑图像一体化方面的竞争力。

4. 性能评测与用户反馈

维度 观察结果 参考来源
代码渲染 能在图中生成可读、无乱码的代码块
人像细节 生成的名人自拍在构图逼真,但皮肤纹理出现“塑料感”,细腻度仍逊于 Nano Banana Pro
整体画质 在自然场景、光影处理上已有提升,但在人像细节上仍有改进空间
竞争对手对比 与 Google 的 Nano Banana Pro 在世界知识层面持平,但在人像细节上略逊

5. 可能的产品路线

  • 短期:继续在 Design Arena 与 LM Arena 收集盲测数据,迭代模型细节(尤其是人像渲染)。
  • 中期:若盲测结果满意,可能随 GPT‑5.2 一同正式发布,作为 OpenAI 多模态生态的重要组成部分。
  • 长期:结合 GPT‑4o 的多模态能力,进一步探索图像‑文本‑代码一体化的创作工作流,提升对开发者和创意工作者的实用价值。

6. 小结

OpenAI 的 Hazelnut 与 Chestnut 两款图像生成模型已经在 Design Arena 与 LM Arena 进行盲测,展示了在代码渲染、世界知识理解等方面的显著进步。虽然在人像细节上仍有提升空间,但整体表现已能与业界领先的 Google Nano Banana Pro 相抗衡。后续若与即将发布的 GPT‑5.2 同步推出,预计将进一步巩固 OpenAI 在多模态 AI 领域的领先地位。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!