OpenAI 下一代图像生成模型疑似现身，已在 Design Arena 与 LM Arena 开启盲测

AI资讯 3个月前硕雀

66 0 0

1. 背景与出现时间

2025 年 12 月 10 日，IT之家等媒体披露，OpenAI 正在内部盲测两款代号为 ‍“Hazelnut（榛子）”‍ 与 ‍“Chestnut（栗子）”‍ 的全新图像生成模型。
这两款模型在过去 24 小时内频繁出现在 Design Arena 与 LM Arena 两大模型竞技场中，暗示它们已进入公开测试阶段。

2. 测试平台简介

平台	主要功能	与 OpenAI 的关联
Design Arena	侧重视觉生成模型的对比评测，提供盲测投票与评分系统，帮助研发团队快速获取用户反馈。	Hazelnut、Chestnut 在该平台提交生成样例，接受社区盲测。
LM Arena	以“语言模型竞技场”形式呈现，用户在不知模型身份的情况下对比不同模型的输出质量。	两款图像模型同样以盲测方式参与，评估其在文本‑图像协同任务中的表现。

3. 技术亮点

文本/代码渲染能力提升
- 与以往模型在图中出现文字或代码时常出现乱码不同，Hazelnut/Chestnut 能在图像中呈现清晰、准确的代码文本。
世界知识与语义理解增强
- 初步盲测显示，这两款模型在通用场景的语义理解上已能与 Google 的 Nano Banana Pro 相抗衡，表现出更强的常识推理能力。
底层架构猜测
- 虽未公开正式技术细节，但业内推测它们基于 GPT‑4o 的多模态架构，而非直接在 gpt‑image‑1 上迭代，意味着 OpenAI 正在探索不同技术路径来提升图像生成质量。
与 GPT‑5.2 的潜在关联
- 有消息称，这两款模型可能作为即将发布的 GPT‑5.2（传闻中的大模型升级版）的伴生产品同步推出，进一步强化 OpenAI 在文本‑图像一体化方面的竞争力。

4. 性能评测与用户反馈

维度	观察结果	参考来源
代码渲染	能在图中生成可读、无乱码的代码块
人像细节	生成的名人自拍在构图逼真，但皮肤纹理出现“塑料感”，细腻度仍逊于 Nano Banana Pro
整体画质	在自然场景、光影处理上已有提升，但在人像细节上仍有改进空间
竞争对手对比	与 Google 的 Nano Banana Pro 在世界知识层面持平，但在人像细节上略逊

5. 可能的产品路线

短期：继续在 Design Arena 与 LM Arena 收集盲测数据，迭代模型细节（尤其是人像渲染）。
中期：若盲测结果满意，可能随 GPT‑5.2 一同正式发布，作为 OpenAI 多模态生态的重要组成部分。
长期：结合 GPT‑4o 的多模态能力，进一步探索图像‑文本‑代码一体化的创作工作流，提升对开发者和创意工作者的实用价值。

6. 小结

OpenAI 的 Hazelnut 与 Chestnut 两款图像生成模型已经在 Design Arena 与 LM Arena 进行盲测，展示了在代码渲染、世界知识理解等方面的显著进步。虽然在人像细节上仍有提升空间，但整体表现已能与业界领先的 Google Nano Banana Pro 相抗衡。后续若与即将发布的 GPT‑5.2 同步推出，预计将进一步巩固 OpenAI 在多模态 AI 领域的领先地位。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！