1. 背景与出现时间
- 2025 年 12 月 10 日,IT之家等媒体披露,OpenAI 正在内部盲测两款代号为 “Hazelnut(榛子)” 与 “Chestnut(栗子)” 的全新图像生成模型。
- 这两款模型在过去 24 小时内频繁出现在 Design Arena 与 LM Arena 两大模型竞技场中,暗示它们已进入公开测试阶段。
2. 测试平台简介
| 平台 | 主要功能 | 与 OpenAI 的关联 |
|---|---|---|
| Design Arena | 侧重视觉生成模型的对比评测,提供盲测投票与评分系统,帮助研发团队快速获取用户反馈。 | Hazelnut、Chestnut 在该平台提交生成样例,接受社区盲测。 |
| LM Arena | 以“语言模型竞技场”形式呈现,用户在不知模型身份的情况下对比不同模型的输出质量。 | 两款图像模型同样以盲测方式参与,评估其在文本‑图像协同任务中的表现。 |
3. 技术亮点
- 文本/代码渲染能力提升
- 与以往模型在图中出现文字或代码时常出现乱码不同,Hazelnut/Chestnut 能在图像中呈现清晰、准确的代码文本。
- 世界知识与语义理解增强
- 初步盲测显示,这两款模型在通用场景的语义理解上已能与 Google 的 Nano Banana Pro 相抗衡,表现出更强的常识推理能力。
- 底层架构猜测
- 虽未公开正式技术细节,但业内推测它们基于 GPT‑4o 的多模态架构,而非直接在 gpt‑image‑1 上迭代,意味着 OpenAI 正在探索不同技术路径来提升图像生成质量。
- 与 GPT‑5.2 的潜在关联
- 有消息称,这两款模型可能作为即将发布的 GPT‑5.2(传闻中的大模型升级版)的伴生产品同步推出,进一步强化 OpenAI 在文本‑图像一体化方面的竞争力。
4. 性能评测与用户反馈
| 维度 | 观察结果 | 参考来源 |
|---|---|---|
| 代码渲染 | 能在图中生成可读、无乱码的代码块 | |
| 人像细节 | 生成的名人自拍在构图逼真,但皮肤纹理出现“塑料感”,细腻度仍逊于 Nano Banana Pro | |
| 整体画质 | 在自然场景、光影处理上已有提升,但在人像细节上仍有改进空间 | |
| 竞争对手对比 | 与 Google 的 Nano Banana Pro 在世界知识层面持平,但在人像细节上略逊 |
5. 可能的产品路线
- 短期:继续在 Design Arena 与 LM Arena 收集盲测数据,迭代模型细节(尤其是人像渲染)。
- 中期:若盲测结果满意,可能随 GPT‑5.2 一同正式发布,作为 OpenAI 多模态生态的重要组成部分。
- 长期:结合 GPT‑4o 的多模态能力,进一步探索图像‑文本‑代码一体化的创作工作流,提升对开发者和创意工作者的实用价值。
6. 小结
OpenAI 的 Hazelnut 与 Chestnut 两款图像生成模型已经在 Design Arena 与 LM Arena 进行盲测,展示了在代码渲染、世界知识理解等方面的显著进步。虽然在人像细节上仍有提升空间,但整体表现已能与业界领先的 Google Nano Banana Pro 相抗衡。后续若与即将发布的 GPT‑5.2 同步推出,预计将进一步巩固 OpenAI 在多模态 AI 领域的领先地位。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!