什么是StreetDance数据集

StreetDance 数据集概览

内容 说明 参考
数据集名称 StreetDance(细粒度街舞动作识别数据集
类别数量 245 种细粒度街舞动作类别
视频片段数 7 095 条视频片段
数据来源 综艺节目、街舞教学视频等,均自带字幕/注解
标注方式 采用 OCR 技术自动读取视频自带的文字注解,再进行半监督标注,兼顾专业性与标注成本
标签层次 具备层次化标签(大类 → 子类),时序信息丰富
适用任务 - 细粒度街舞动作识别
- 动作迁移学习
- 视频理解与跨模态检索
- 艺术创作辅助
基准模型 论文中提出的 TSATM(基于 2D CNN + ATM 模块)已在该数据集上进行评估
下载方式 项目代码与数据下载脚本均托管在 GitHub,页面提供数据下载链接与使用说明
GitHub 地址 https://github.com/LiuRicky/tsatm-pytorch
论文引用 Liu, R. et al. “Fine‑grained Action Recognition Dataset ‘StreetDance’”, 2024.(可在 GitHub README 中找到完整引用信息)

获取方式

  • 访问 GitHub 项目页面(上表链接),在 README.md 中有 “Download” 部分,提供数据压缩包(约数 GB)以及对应的下载脚本。
  • 通过 bash ./scripts/download_data.sh(或页面提供的直接链接)即可下载全部 7 095 条视频及其层次化标签文件。

相关数据集(补充参考)

数据集 内容概述 下载入口
AIST Dance Video Database 大规模街舞视频库,包含 13 939 条视频,覆盖 10 种街舞流派、60 首版权清晰的舞蹈音乐,提供多摄像头视角、solo 与 group 形式、basic/advanced/移动摄像机等多种子类。适用于舞蹈动作分类、舞者识别、舞蹈‑音乐关联等研究。 https://aistdancedb.ongaaccel.jp/database_download/ (ZIP 包、音乐文件、任务子集等)
规模 1 618 支街舞(13 939 条视频),40 位专业舞者(25 男 / 15 女),每个流派 1 380 条视频,另有 49 条情境视频(showcase、cypher、battle)。
主要任务 多模态舞蹈信息处理(动作分析、动作生成、音乐分析、音乐生成),提供基准 LSTM / SVM 分类结果(最高 91.4% 准确率)。

使用建议

  1. 细粒度动作识别:利用层次化标签,可直接训练细粒度分类网络(如 TSATM、TSM、SlowFast 等),对比不同时序建模方式的效果。
  2. 跨模态检索:数据集自带音乐注解,可构建“动作 ↔ 音乐”检索任务,探索音视频对齐或生成模型。
  3. 迁移学习:将 StreetDance 预训练的特征迁移到其他舞蹈或通用动作数据集(如 Kinetics、HMDB51),评估细粒度特征的通用性。
  4. 多视角学习(结合 AIST 数据):若需要多摄像头视角的空间一致性学习,可将 StreetDance 与 AIST 的多视角视频配合,实验跨视角动作识别或姿态估计

总结
StreetDance 是目前首个专注于街舞细粒度动作的公开数据集,提供了丰富的类别、时序信息和层次化标签,配套的 GitHub 项目提供下载脚本和基准模型,适合动作识别、跨模态检索、迁移学习等多种研究方向。若需要更大规模、更多视角的街舞视频,可参考同属 AIST 的 AIST Dance Video Database,两者结合可进一步推动街舞信息处理的深度研究。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!