EyeDiap 数据集概览
1. 什么是 EyeDiap
EyeDiap(全称 EYEDIAP: A Database for the Development and Evaluation of Gaze Estimation Algorithms from RGB and RGB‑D Cameras)是专为视线(gaze)估计研究设计的实验室级别数据集,提供高质量的 RGB(以及可选的深度)视频与精确的注视与头部姿态标注。该数据集在学术界被广泛用于评估和比较基于外观的视线估计算法。
2. 数据采集与实验设置
- 参与者:16 位受试者(男女比例约 11:5),每位受试者在实验室环境下完成采集。
- 视频数量:共 94 段视频,每段约 2–3 分钟。
- 目标模式:三种视觉目标
- 连续移动目标(continuous screen target)——目标在屏幕上沿随机轨迹平滑移动;
- 离散移动目标(discrete screen target)——目标在屏幕上随机出现并保持固定;
- 漂浮球目标(3D floating ball)——小球在摄像机与受试者之间的 3D 空间中移动(该模式常因遮挡而在后续实验中被剔除)。
- 硬件:前视 RGB 相机(VGA/HD)记录,部分实验配备 RGB‑D(Kinect)深度相机,以便提供 3D 信息。
3. 数据结构与标注内容
每帧提供以下信息(以 .label
文件为主):
字段 | 含义 |
---|---|
face 、left 、right |
对应的全脸、左眼、右眼图像路径 |
3DGaze |
归一化的 3D 注视方向向量 |
3DHead |
归一化的 3D 头部姿态向量 |
2DGaze |
2D 注视角(yaw、pitch) |
2DHead |
2D 头部姿态角(yaw、pitch) |
Rvec |
相机坐标系到归一化坐标系的旋转向量 |
Svec |
归一化过程中的尺度向量 |
GazeOrigin |
归一化坐标系下的注视原点(3D) |
此外,原始数据还包含原始视频、相机内参以及深度图(若使用 RGB‑D 采集)。
4. 数据规模与划分
- 原始视频:94 × 16 = 约 1500 秒的原始录像。
- 处理后图像:常用的标准评估子集包含 15 位受试者、每人约 3000 张图像(左眼 1500 张、右眼 1500 张)。
- 预处理:官方提供的脚本
data_processing_diap.py
可将 VGA 视频每 15 帧抽取一帧并完成归一化、直方图均衡等步骤,生成统一的out_root
目录结构。
5. 如何获取数据
- 原始数据下载:在北京航空航天大学 Gazehub 项目页面的 “Datasets” 栏中提供下载链接(需填写使用协议)。
- 归一化/预处理版:同页面提供
cluster_diap.py
与data_processing_diap.py
脚本,直接运行即可得到已归一化的图像与标注文件。 - 使用指南:官方 PDF “Dataset Introduction EyeDiap” 详细说明文件结构、
.label
格式以及读取示例代码,适合快速上手。
获取入口
- 项目主页(含下载链接):
https://phi-ai.buaa.edu.cn/Gazehub/3D-dataset/
- 数据使用手册(PDF):
https://phi-ai.buaa.edu.cn/Gazehub/Guideline/FaceBased/EyeDiap.pdf
6. 常见使用场景
- 视线估计模型训练与评估:提供标准的训练/测试划分,支持交叉验证或 Leave‑One‑Subject‑Out(LOSO)评估。
- 头部姿态与视线联合建模:数据中同时给出 3D 头部姿态,可用于研究 “Gaze | Head” 融合方法。
- RGB‑D 视线研究:部分子集包含深度图,适合多模态学习。
- 数据增强与迁移学习:可与其他公开数据集(如 MPIIGaze、ETH‑XGaze)联合使用,提升模型的跨域鲁棒性。
7. 参考文献与引用
- Funes Mora, K. A., Monay, F., & Odobez, J.-M. (2014). EYEDIAP: A Database for the Development and Evaluation of Gaze Estimation Algorithms from RGB and RGB‑D Cameras.(请在使用时引用此论文)
- Cheng, Y., Wang, H., Bao, Y., & Lu, F. (2021). Appearance‑based Gaze Estimation With Deep Learning: A Review and Benchmark(对数据集规模与评估集的描述)
- 其他技术细节可参考官方手册 PDF 与代码仓库(
data_processing_diap.py
)。
小结
EyeDiap 是一个高质量、标注完整的实验室级视线数据集,包含 16 位受试者、94 段视频以及丰富的 2D/3D 注视与头部姿态信息。官方提供原始视频、归一化处理脚本以及详细使用指南,适合作为视线估计、头部姿态融合以及多模态(RGB‑D)研究的基准数据。通过上述链接即可获取并快速开始实验。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!