1. 数据集简介
Diving48 是由 Li 等人在 2018 年提出的细粒度视频动作识别数据集,专注于竞技跳水动作的完整序列。每条视频都可以拆解为 起跳方式、空中动作、入水姿态 三个阶段,因而对时空建模提出了更高要求。
2. 数据规模与划分
- 总视频数:约 18 404 条(约 18 k 条剪辑)
- 训练集 / 测试集:训练 16 067 条,测试 2 337 条
- 每条时长:约 10 秒,均为裁剪后的完整跳水动作
- 场景:画面仅包含跳板、泳池和观众席,背景干净、无其他干扰对象
3. 类别与动作分解
- 类别数:48 类,分别对应 48 种不重复的跳水动作(如 3 米板前向翻腾 2 次、向后翻腾 1 次等)
- 动作结构:每个类别由 起跳类型、空中姿态(翻腾、扭转等)、入水姿势 三部分组合而成,要求模型能够捕捉细微的时序差异。
4. 数据获取方式
- 官方页面:
- 主站点(SVCL 实验室):
http://www.svcl.ucsd.edu/projects/resound/dataset.html
- 另一个可访问的镜像:
http://www.svc.ucsd.edu/projects/resound/dataset.html
(同一页面的不同域名)
- 主站点(SVCL 实验室):
- 页面提供 下载链接(需填写申请表),以及 数据划分说明、类别映射表、视频示例。
5. 研究中的常见使用场景
研究方向 | 典型工作 | 说明 |
---|---|---|
多尺度时空建模 | Video‑ception、SlowFast、GST‑ResNet 等 | 将 Diving48 作为细粒度时序建模基准,验证长程依赖捕获能力 |
动作原子分解 | 3D‑Yoga、FinePseudo 等 | 通过先识别短时原子动作再组合长时序列,展示对起跳‑飞行‑入水三阶段的细粒度辨识 |
迁移学习评估 | 3D‑ResNet‑50、I3D 等 | 在 Diving48 上微调后评估模型在细粒度动作上的提升,常与 Kinetics、UCF‑101 等通用数据集对比 |
数据偏差分析 | Quantifying & Learning Static vs. Dynamic 信息 | 用于检验数据集是否偏向静态或动态特征,发现 Diving48 并非强动态偏置 |
这些工作表明 Diving48 已成为 细粒度体育动作识别 的重要基准,尤其在需要捕捉长时序依赖的模型评估中被广泛采用。
6. 相关链接与资源
- 原始论文(Li 等,2018): “Diving48: A Fine‑grained Dataset for Competitive Diving”
- 数据集主页:
http://www.svcl.ucsd.edu/projects/resound/dataset.html
- 下载页面(需登录或填写申请): 同上提供的 “Download” 按钮
- MMACTION2 配置示例(常用于快速实验): 在 MMACTION2 官方仓库的
configs/datasets/diving48/
目录下可找到数据读取脚本和基准配置(可在 GitHub 上搜索 “mmaction2 diving48”) - 常用基准报告: 多篇 CVPR/ICCV/ACCV 论文中均报告了在 Diving48 上的 Top‑1/Top‑5 准确率,可作为模型对比的参考。
通过上述官方页面和公开论文,你可以获取完整的数据说明、下载链接以及常用的基准实现,便于在自己的研究或项目中直接使用。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!