什么是NUS‑WIDE数据集

AI解读 4小时前 硕雀
2 0

NUS‑WIDE 数据集概述

  • 全称NUS‑WIDE: a real‑world web image database from National University of Singapore新加坡国立大学真实网络图像数据库)
  • 创建机构:新加坡国立大学媒体搜索实验室(Media Search Lab)
  • 发布时间:最早于 2009 年公开,后续在 IEEE Dataport 等平台重新发布,DOI 为 10.21227/y5ds‑0b08

1. 数据规模与结构

项目 说明
图像数量 269 648 张来自 Flickr 的真实网络图片
标签总数 5 018 条原始标签(每张图像平均 2‑5 条)
概念标签 81 个高层次概念(包括物体、场景等),用于多标签学习
特征提供 颜色直方图、边缘直方图、纹理特征、SIFT 词袋(500 维)以及文本词向量(1000 维)
划分 训练集 161 789 张,测试集 107 859 张

2. 主要用途

  • 多标签图像分类:利用 81 个概念标签进行多标签学习实验
  • 跨模态检索:图像‑文本对可用于图像检索、文本检索以及跨模态哈希研究
  • 零样本学习、图像检索、聚类:在 PapersWithCode 等平台列出多种任务的基准模型

3. 下载与获取方式

平台 链接 说明
官方页面 <http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm >(原始数据发布地址)
IEEE Dataport <https://ieee-dataport.org/documents/nus-wide >(提供 DOI 与下载链接)
PapersWithCode <https://paperswithcode.com/dataset/nus-wide >(包含任务列表与代码实现)
Hyper AI 数据集平台 <https://hyper.ai/en/datasets/16124 >(提供数据概览与下载入口)
TIB Data Service <https://service.tib.eu/ldmservice/dataset/nus-wide-dataset >(元数据 JSON 与 DOI)

4. 关键文献

  • 原始论文:Chua, T.‑S., Tang, J., Hong, R., Li, H., Luo, Z., & Zheng, Y. (2009). NUS‑WIDE: a real‑world web image database from National University of Singapore.(可在 IEEE Dataport 或作者主页获取)
  • 后续综述:刘颖等《深度学习跨模态图文检索研究综述》提及 NUS‑WIDE 为跨模态哈希常用基准

5. 使用注意事项

  • 数据集受 CC‑BY‑4.0 许可,使用时需注明原始论文与数据来源。
  • 部分图片 URL 已失效,需自行爬取或使用提供的备份文件;建议在下载时使用 VPN 以提升成功率。

总结:NUS‑WIDE 是一个规模达 27 万余张、标注有 81 个概念标签的多标签网络图像数据集,广泛用于图像分类、跨模态检索和多标签学习等研究。其官方页面、IEEE Dataport、PapersWithCode 等平台均提供下载与详细说明,研究者可根据需求选择合适的入口获取数据。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!