什么是GazeCapture数据集

AI解读 2个月前硕雀

37 0 0

GazeCapture 是首个面向移动设备的大规模眼动追踪数据集，由 MIT CSAIL 与多所高校合作在 2016 年公开。它通过众包方式在 iPhone / iPad 上采集，旨在让“眼动追踪走进每个人的掌中”，为在普通智能手机和平板上实现高精度 gaze estimation 提供训练素材。

项目	说明
参与者数量	约 1 450–1 474 名（覆盖不同年龄、性别、种族）
图像帧数	约 2.4 M–2.5 M 帧（超过 2 445 504 张图像）
采集设备	iPhone / iPad 前置摄像头，支持多种屏幕方向（竖屏、横屏）
标注类型	屏幕上 2D 注视点（像素坐标）以及相机到眼睛的物理距离，兼容设备无关的坐标系
数据划分	训练 1 251 983 张、验证 59 480 张、测试 179 496 张（共 1 490 959 张有效帧）

资源	链接
数据集主页（含下载链接、说明文档）	https://gazecapture.csail.mit.edu/download.php
原始论文（CVPR 2016）	“Eye Tracking for Everyone” – Krafka et al., CVPR 2016
iTracker 代码与模型	同上论文附带的 GitHub 仓库（GitHub - CSAILVision/GazeCapture: Eye Tracking for Everyone）
相关评测与基准报告	多篇后续论文（如 Adaptive Feature Fusion Network、iTracker 评测）均引用 GazeCapture 进行实验

GazeCapture 通过大规模、真实世界的移动端采集，填补了传统实验室眼动数据集在规模与多样性上的空白，为移动设备上的视线追踪提供了坚实的数据基础。其公开的下载渠道、完整的标注以及配套的 iTracker 模型，使其成为眼动研究与实际应用的核心基准资源。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！