SuperCLUE多模态视觉评测榜(SuperCLUE-VLM)是中文多模态视觉语言模型测评基准,旨在评估模型在基础认知、视觉推理和视觉应用三大核心维度上的能力。2025年8月发布的8月榜单中,Gemini-2.5-Pro位居第一,总分为74.99分。该榜单涵盖了15款多模态模型,包括Claude-Opus-4.1、GPT-5 (high)、ERNIE-4.5-Turbo-VL等。
Gemini-2.5-Pro在评测中表现突出,总分74.99分,领先于GPT-5 (high)(68.59分)和百度ERNIE-4.5-Turbo-VL(66.47分)。百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一,显示中国在多模态大模型领域的竞争力。
SuperCLUE-VLM评测基于中文场景特点,全面考察模型在真实任务场景下的能力,评测维度包括基础认知、视觉推理和视觉应用。评测结果显示,Gemini-2.5-Pro在空间推理、医疗影像分析和多模态指令跟随能力方面表现优异。
Gemini-2.5-Pro是目前最强的多模态AI模型之一,尤其在视觉推理和多模态任务中表现突出。尽管其在多模态表格解析任务上仍有改进空间,但整体性能领先于其他模型。
SuperCLUE-VLM评测榜单不仅反映了当前多模态模型的最新进展,也为模型开发者和研究者提供了重要的参考标准
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!