什么是SACap‑Eval

AI解读 3个月前硕雀

60 0 0

SACap‑Eval 是在 SACap‑1M 数据集基础上构建的评估基准，专门用于衡量 分割掩码到图像生成（Seg‑Mask‑to‑Image, S2I）‍ 模型的质量。它由 Seg2Any 论文提出，旨在提供一个既覆盖空间位置又覆盖属性细节的综合评价体系。

SACap‑Eval 从 两大视角 进行评估：

维度	说明
空间（Spatial）‍	对每个分割掩码裁剪出的局部图像，使用视觉语言模型（如 Qwen2‑VL‑72B）进行视觉问答，判断目标实体是否位于该区域，答案仅为 “Yes” 或 “No”。
属性（Attribute）‍	通过同一视觉语言模型提问实体的颜色、形状、纹理等属性，检验生成图像在细粒度属性控制上的准确性。

两类问题均采用 VLM‑based VQA 方式自动打分，能够客观量化模型在空间定位和属性表达上的表现。

在论文的消融实验中，这些指标被用于对比不同模型组件的贡献。

通过上述链接可以获取完整的基准设计、数据统计以及实验结果，帮助您深入了解 SACap‑Eval 的构建方法和评估流程。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！