什么是Diving48数据集

AI解读 2小时前 硕雀
2 0

Diving48 数据集概览

1. 数据集简介

Diving48 是由 Li 等人在 2018 年提出的细粒度视频动作识别数据集,专注于竞技跳水动作的完整序列。每条视频都可以拆解为 起跳方式、空中动作、入水姿态 三个阶段,因而对时空建模提出了更高要求。

2. 数据规模与划分

  • 总视频数:约 18 404 条(约 18 k 条剪辑)
  • 训练集 / 测试集:训练 16 067 条,测试 2 337 条
  • 每条时长:约 10 秒,均为裁剪后的完整跳水动作
  • 场景:画面仅包含跳板、泳池和观众席,背景干净、无其他干扰对象

3. 类别与动作分解

  • 类别数:48 类,分别对应 48 种不重复的跳水动作(如 3 米板前向翻腾 2 次、向后翻腾 1 次等)
  • 动作结构:每个类别由 起跳类型空中姿态(翻腾、扭转等)‍、入水姿势 三部分组合而成,要求模型能够捕捉细微的时序差异。

4. 数据获取方式

  • 官方页面
    • 主站点(SVCL 实验室): http://www.svcl.ucsd.edu/projects/resound/dataset.html
    • 另一个可访问的镜像: http://www.svc.ucsd.edu/projects/resound/dataset.html (同一页面的不同域名
  • 页面提供 下载链接(需填写申请表),以及 数据划分说明类别映射表视频示例

5. 研究中的常见使用场景

研究方向 典型工作 说明
多尺度时空建模 Video‑ception、SlowFast、GST‑ResNet 将 Diving48 作为细粒度时序建模基准,验证长程依赖捕获能力
动作原子分解 3D‑Yoga、FinePseudo 等 通过先识别短时原子动作再组合长时序列,展示对起跳‑飞行‑入水三阶段的细粒度辨识
迁移学习评估 3D‑ResNet‑50、I3D 等 在 Diving48 上微调后评估模型在细粒度动作上的提升,常与 Kinetics、UCF‑101 等通用数据集对比
数据偏差分析 Quantifying & Learning Static vs. Dynamic 信息 用于检验数据集是否偏向静态或动态特征,发现 Diving48 并非强动态偏置

这些工作表明 Diving48 已成为 细粒度体育动作识别 的重要基准,尤其在需要捕捉长时序依赖的模型评估中被广泛采用。

6. 相关链接与资源

  • 原始论文(Li 等,2018): “Diving48: A Fine‑grained Dataset for Competitive Diving”
  • 数据集主页http://www.svcl.ucsd.edu/projects/resound/dataset.html
  • 下载页面(需登录或填写申请): 同上提供的 “Download” 按钮
  • MMACTION2 配置示例(常用于快速实验): 在 MMACTION2 官方仓库的 configs/datasets/diving48/ 目录下可找到数据读取脚本和基准配置(可在 GitHub 上搜索 “mmaction2 diving48”)
  • 常用基准报告: 多篇 CVPR/ICCV/ACCV 论文中均报告了在 Diving48 上的 Top‑1/Top‑5 准确率,可作为模型对比的参考。

通过上述官方页面和公开论文,你可以获取完整的数据说明、下载链接以及常用的基准实现,便于在自己的研究或项目中直接使用。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!