什么是光流（Optical Flow）

AI解读 1年前 (2024) 硕雀

355 0 0

光流（Optical Flow）‍ 是计算机视觉和图像处理领域的核心概念，指的是图像序列（通常是视频）中像素点在时间维度上的运动状态。简单来说，它描述了图像中每个像素点在连续帧之间如何移动（方向和速度）。

光流是一种像素级的运动场。它表示相邻两帧图像中，每个像素点的运动速度（有多快）和运动方向（往哪里）。这个运动场通常被表示为一个二维向量场，即每个像素点都对应着一个二维向量（水平位移u，垂直位移v）。

直观理解：
想象你坐在一辆行驶的火车上往窗外看。你看到的树木、建筑在向后退运动，这种视觉上的“流动”就是光流。

光流的计算基于以下几个核心假设：

基于这些假设，可以通过比较相邻帧的像素亮度差异来推断像素的运动矢量。

根据计算的粒度，光流算法通常分为两大类：

稀疏光流（Sparse Optical Flow）‍：
- 定义：仅计算图像中特定特征点（如角点、边缘点）的运动。
- 特点：计算量小，实时性好，但只能追踪局部特征，无法描述整个场景的运动。
- 典型算法：Lucas-Kanade（LK）算法。
稠密光流（Dense Optical Flow）‍：
- 定义：计算每个像素点的运动矢量。
- 特点：信息量大，能描述细腻的运动细节，但计算量大，耗时多。
- 典型算法：Horn-Schunck算法、Farnebäck算法。

稀疏光流中最经典的算法是Lucas-Kanade（LK）算法。它的核心思想是：

光流技术广泛应用于需要理解运动的场景，包括但不限于：

虽然光流是非常有用的技术，但它也面临挑战：

光流就像是为静态图像赋予了“时间维度”，它捕捉了“图像中的运动”。在现代计算机视觉中，光流是理解视频内容、实现动态交互的基础之一。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！