| 内容 | 说明 |
|---|---|
| 全称 | HMDB: A Large Human Motion Database(HMDB‑51) |
| 发布年份 | 2011(ICCV) |
| 视频数量 | 6 849(或 6 766)个剪辑 |
| 动作类别 | 51 类人类动作,每类至少 101 条视频 |
| 来源 | 主要来自商业电影,少量来自 YouTube、Google 视频、Prelinger 档案等 |
| 分辨率 & 帧率 | 320 × 240 像素,约 25 FPS,时长 3–4 秒/片段 |
| 划分方式 | 提供 3 种标准划分(train/test split),每种划分下约 5 000 条训练、2 000 条测试视频,最终报告三划分的平均准确率 |
| 使用场景 | 动作识别基准、时空特征学习、跨模态视频‑文本研究等 |
1. 数据集简介
HMDB‑51 是动作识别领域的经典基准,收录了日常生活中常见的 51 种人类行为(如走路、跑步、跳舞、吃东西、刷牙等),并且在拍摄角度、光照、背景等方面具有较大变异,因而对模型的泛化能力提出了挑战。
2. 主要特点
- 多源采集:大部分视频取自电影,少量来自公开网络视频,覆盖丰富的场景与摄像机运动。
- 类别平衡:每类至少 101 条剪辑,保证了基本的类别平衡,但仍存在一定的难度差异。
- 标准划分:官方提供三套划分(split 1/2/3),常用于报告模型的平均准确率,以消除划分偶然性。
- 开放许可:数据集采用 CC‑BY‑4.0 许可,可自由下载与使用。
3. 下载与获取方式
- 官方页面(包含数据说明、下载链接、论文 PDF):
https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database - 原始论文(ICCV 2011):
“HMDB: A Large Video Database for Human Motion Recognition”,可在 IEEE Xplore 或 arXiv 上检索。 - 镜像与工具:GitHub 上有多种预处理脚本和数据加载实现,例如
voxel51/fiftyone提供的 HMDB‑51 数据集描述与下载脚本。
4. 常用评估指标
5. 研究与应用
HMDB‑51 被广泛用于:
总结
HMDB‑51 是动作识别领域的标准小规模基准,包含 51 类、约 7 千条视频,来源多样、划分明确、许可宽松,适合作为模型研发、算法对比以及跨模态研究的实验平台。通过官方页面即可获取完整数据和文献支持。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!