什么是HMDB51数据集

AI解读 2小时前 硕雀
2 0

HMDB51(Human Motion Database 51‍ 是计算机视觉领域用于人类动作识别Human Action Recognition)的经典基准数据集之一。它于2011年由Brown University的 Hildeg Kuehne 等人在 ICCV 2011 上发布。

以下是关于 HMDB51 数据集的详细介绍:

1. 数据集概况

  • 全称:Human Motion Database 51
  • 规模:共包含 6,849 段视频片段
  • 类别:共 51 个动作类别
  • 每类样本:每个类别至少包含 101 段视频
  • 来源:数据主要来自数字化电影(Digital Movies),同时也包含了一小部分来自公开数据库(如 Prelinger Archive)和网络视频(如 YouTube、Google 视频)。

2. 动作类别划分

HMDB51 将动作分为五大类,涵盖了从日常生活动作到复杂的互动动作,具体如下:

  • 一般面部动作:微笑(Smile)、大笑(Laugh)、咀嚼(Chew)、交谈(Talk)。
  • 面部操作与对象操作:吸烟(Smoke)、吃(Eat)、喝(Drink)。
  • 一般身体动作:跑步(Run)、走路(Walk)、跳跃(Jump)、翻筋斗(Cartwheel)、爬楼梯(Climb Stairs)。
  • 与对象交互动作:梳头(Brush Hair)、打高尔夫(Golf)、踢球(Kick Ball)、骑自行车(Ride Bike)、射击(Shoot)。
  • 人体交互动作:拥抱(Hug)、亲吻(Kiss)、拳打(Punch)、握手(Shake Hands)、击剑(Fencing)。

3. 数据集特点

  • 多样性:视频内容多样,包含不同的光照条件环境背景拍摄方式。有些视频来自黑白电影,有些是彩色的。
  • 视角变化:包括不同的相机视角(Camera Viewpoints)和相机运动(Camera Motion),如静止拍摄、跟拍等。
  • 元数据丰富:除了动作标签外,每个视频还包含元信息(Metadata),如视频质量(Quality)、可见的身体部位(Visible Body Parts)、参与人数(Number of People)等。
  • 数据质量:视频质量不一,有些是高质量的电影片段,有些是较为模糊的网络视频,增加了任务的挑战性。

4. 评价协议

HMDB51 的评价标准是采用三折交叉验证(Three-fold Cross-validation):

  • 标准划分:每个动作类别被随机划分为 70% 的训练集和 30% 的测试集,且这种划分方式有三套不同的划分方案。
  • 结果报告:在报告模型性能时,通常会取这三套划分的平均准确率作为最终的评估指标。

5. 相关链接

以下是获取 HMDB51 数据集及相关资源的链接:

总结

HMDB51 以其动作类别丰富(51类)和来源多样(电影、网络视频)的特点,成为了动作识别算法评估的“硬核”标准之一。它比 UCF101 更注重动作的细粒度区分和复杂的拍摄条件,是验证模型鲁棒性的关键数据集。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!