什么是HMDB‑51数据集

AI解读 4个月前 硕雀
54 0

HMDB‑51 数据集概览

内容 说明
全称 HMDB: A Large Human Motion Database(HMDB‑51)
发布年份 2011(ICCV
视频数量 6 849(或 6 766)个剪辑
动作类别 51 类人类动作,每类至少 101 条视频
来源 主要来自商业电影,少量来自 YouTube、Google 视频、Prelinger 档案等
分辨率 & 帧率 320 × 240 像素,约 25 FPS,时长 3–4 秒/片段
划分方式 提供 3 种标准划分(train/test split),每种划分下约 5 000 条训练、2 000 条测试视频,最终报告三划分的平均准确率
使用场景 动作识别基准、时空特征学习、跨模态视频‑文本研究等

1. 数据集简介

HMDB‑51 是动作识别领域的经典基准,收录了日常生活中常见的 51 种人类行为(如走路、跑步、跳舞、吃东西、刷牙等),并且在拍摄角度、光照、背景等方面具有较大变异,因而对模型的泛化能力提出了挑战。

2. 主要特点

  • 多源采集:大部分视频取自电影,少量来自公开网络视频,覆盖丰富的场景与摄像机运动。
  • 类别平衡:每类至少 101 条剪辑,保证了基本的类别平衡,但仍存在一定的难度差异。
  • 标准划分:官方提供三套划分(split 1/2/3),常用于报告模型的平均准确率,以消除划分偶然性。
  • 开放许可:数据集采用 CC‑BY‑4.0 许可,可自由下载与使用。

3. 下载与获取方式

  • 官方页面(包含数据说明、下载链接、论文 PDF):
    https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database
  • 原始论文(ICCV 2011):
    “HMDB: A Large Video Database for Human Motion Recognition”,可在 IEEE Xplore 或 arXiv 上检索。
  • 镜像与工具GitHub 上有多种预处理脚本和数据加载实现,例如 voxel51/fiftyone 提供的 HMDB‑51 数据集描述与下载脚本。

4. 常用评估指标

  • 分类准确率(Top‑1 Accuracy‍:对每个划分分别计算,然后取三划分的平均值。
  • 其他指标:在部分研究中会报告平均精确率(mAP)或召回率,以评估模型在不平衡类别上的表现。

5. 研究与应用

HMDB‑51 被广泛用于:


总结
HMDB‑51 是动作识别领域的标准小规模基准,包含 51 类、约 7 千条视频,来源多样、划分明确、许可宽松,适合作为模型研发、算法对比以及跨模态研究的实验平台。通过官方页面即可获取完整数据和文献支持。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!