- 全称:NUS‑WIDE: a real‑world web image database from National University of Singapore(新加坡国立大学真实网络图像数据库)
- 创建机构:新加坡国立大学媒体搜索实验室(Media Search Lab)
- 发布时间:最早于 2009 年公开,后续在 IEEE Dataport 等平台重新发布,DOI 为 10.21227/y5ds‑0b08
1. 数据规模与结构
| 项目 | 说明 |
|---|---|
| 图像数量 | 269 648 张来自 Flickr 的真实网络图片 |
| 标签总数 | 5 018 条原始标签(每张图像平均 2‑5 条) |
| 概念标签 | 81 个高层次概念(包括物体、场景等),用于多标签学习 |
| 特征提供 | 颜色直方图、边缘直方图、纹理特征、SIFT 词袋(500 维)以及文本词向量(1000 维) |
| 划分 | 训练集 161 789 张,测试集 107 859 张 |
2. 主要用途
- 多标签图像分类:利用 81 个概念标签进行多标签学习实验
- 跨模态检索:图像‑文本对可用于图像检索、文本检索以及跨模态哈希研究
- 零样本学习、图像检索、聚类等:在 PapersWithCode 等平台列出多种任务的基准模型
3. 下载与获取方式
| 平台 | 链接 | 说明 |
|---|---|---|
| 官方页面 | <http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm >(原始数据发布地址) | |
| IEEE Dataport | <https://ieee-dataport.org/documents/nus-wide >(提供 DOI 与下载链接) | |
| PapersWithCode | <https://paperswithcode.com/dataset/nus-wide >(包含任务列表与代码实现) | |
| Hyper AI 数据集平台 | <https://hyper.ai/en/datasets/16124 >(提供数据概览与下载入口) | |
| TIB Data Service | <https://service.tib.eu/ldmservice/dataset/nus-wide-dataset >(元数据 JSON 与 DOI) |
4. 关键文献
- 原始论文:Chua, T.‑S., Tang, J., Hong, R., Li, H., Luo, Z., & Zheng, Y. (2009). NUS‑WIDE: a real‑world web image database from National University of Singapore.(可在 IEEE Dataport 或作者主页获取)
- 后续综述:刘颖等《深度学习跨模态图文检索研究综述》提及 NUS‑WIDE 为跨模态哈希常用基准
5. 使用注意事项
总结:NUS‑WIDE 是一个规模达 27 万余张、标注有 81 个概念标签的多标签网络图像数据集,广泛用于图像分类、跨模态检索和多标签学习等研究。其官方页面、IEEE Dataport、PapersWithCode 等平台均提供下载与详细说明,研究者可根据需求选择合适的入口获取数据。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!