SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

AI资讯 7个月前硕雀

228 0 0

SuperCLUE多模态视觉评测榜（SuperCLUE-VLM）是中文多模态视觉语言模型测评基准，旨在评估模型在基础认知、视觉推理和视觉应用三大核心维度上的能力。2025年8月发布的8月榜单中，Gemini-2.5-Pro位居第一，总分为74.99分。该榜单涵盖了15款多模态模型，包括Claude-Opus-4.1、GPT-5 (high)、ERNIE-4.5-Turbo-VL等。

Gemini-2.5-Pro在评测中表现突出，总分74.99分，领先于GPT-5 (high)（68.59分）和百度ERNIE-4.5-Turbo-VL（66.47分）。百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一，显示中国在多模态大模型领域的竞争力。

SuperCLUE-VLM评测基于中文场景特点，全面考察模型在真实任务场景下的能力，评测维度包括基础认知、视觉推理和视觉应用。评测结果显示，Gemini-2.5-Pro在空间推理、医疗影像分析和多模态指令跟随能力方面表现优异。

Gemini-2.5-Pro是目前最强的多模态AI模型之一，尤其在视觉推理和多模态任务中表现突出。尽管其在多模态表格解析任务上仍有改进空间，但整体性能领先于其他模型。

SuperCLUE-VLM评测榜单不仅反映了当前多模态模型的最新进展，也为模型开发者和研究者提供了重要的参考标准

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

xAI隆重推出Grok Code Fast1:快速、经济的高效代理编码模型

OpenAI 正式向免费用户开放了 ChatGPT Projects 功能