HMDB51(Human Motion Database 51) 是计算机视觉领域用于人类动作识别(Human Action Recognition)的经典基准数据集之一。它于2011年由Brown University的 Hildeg Kuehne 等人在 ICCV 2011 上发布。
以下是关于 HMDB51 数据集的详细介绍:
1. 数据集概况
- 全称:Human Motion Database 51
- 规模:共包含 6,849 段视频片段
- 类别:共 51 个动作类别
- 每类样本:每个类别至少包含 101 段视频
- 来源:数据主要来自数字化电影(Digital Movies),同时也包含了一小部分来自公开数据库(如 Prelinger Archive)和网络视频(如 YouTube、Google 视频)。
2. 动作类别划分
HMDB51 将动作分为五大类,涵盖了从日常生活动作到复杂的互动动作,具体如下:
- 一般面部动作:微笑(Smile)、大笑(Laugh)、咀嚼(Chew)、交谈(Talk)。
- 面部操作与对象操作:吸烟(Smoke)、吃(Eat)、喝(Drink)。
- 一般身体动作:跑步(Run)、走路(Walk)、跳跃(Jump)、翻筋斗(Cartwheel)、爬楼梯(Climb Stairs)。
- 与对象交互动作:梳头(Brush Hair)、打高尔夫(Golf)、踢球(Kick Ball)、骑自行车(Ride Bike)、射击(Shoot)。
- 人体交互动作:拥抱(Hug)、亲吻(Kiss)、拳打(Punch)、握手(Shake Hands)、击剑(Fencing)。
3. 数据集特点
- 多样性:视频内容多样,包含不同的光照条件、环境背景和拍摄方式。有些视频来自黑白电影,有些是彩色的。
- 视角变化:包括不同的相机视角(Camera Viewpoints)和相机运动(Camera Motion),如静止拍摄、跟拍等。
- 元数据丰富:除了动作标签外,每个视频还包含元信息(Metadata),如视频质量(Quality)、可见的身体部位(Visible Body Parts)、参与人数(Number of People)等。
- 数据质量:视频质量不一,有些是高质量的电影片段,有些是较为模糊的网络视频,增加了任务的挑战性。
4. 评价协议
HMDB51 的评价标准是采用三折交叉验证(Three-fold Cross-validation):
5. 相关链接
以下是获取 HMDB51 数据集及相关资源的链接:
- 官方网站/数据下载:
- Brown University 官方页面(需申请下载):https://serre-lab.clps.brown.edu/hmdb51/
- TIB 数据库镜像(TIB提供了数据集的元数据和引用信息):https://service.tib.eu/ldmservice/dataset/hmdb51
- 论文原文:
- ICCV 2011 官方论文(详细介绍了数据集的构建过程):https://serre-lab.clps.brown.edu/wp-content/uploads/2012/08/Kuehne_etal_iccv11.pdf
- 论文复现/基准代码:
- Papers With Code(包含了大量在 HMDB51 上实现的代码仓库和模型排行榜):https://paperswithcode.com/dataset/hmdb51
- 社区讨论/技术支持:
- 腾讯云开发者社区(包含了很多关于如何加载、预处理 HMDB51 数据集的技术文章和代码示例):https://cloud.tencent.com/search?keys=hmdb51
总结
HMDB51 以其动作类别丰富(51类)和来源多样(电影、网络视频)的特点,成为了动作识别算法评估的“硬核”标准之一。它比 UCF101 更注重动作的细粒度区分和复杂的拍摄条件,是验证模型鲁棒性的关键数据集。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!