什么是运动向量（Motion Vector）

AI解读 6小时前硕雀

2 0 0

运动向量（Motion Vector，MV）概述

基本定义
运动向量是视频帧中某个宏块（或子块）相对于参考帧（前帧、后帧或双向帧）位置的位移量，用一对水平、垂直坐标表示。它描述了像素块在时间轴上的“运动轨迹”，是帧间预测（Motion‑Compensation Prediction）的核心数据。
在视频编码中的作用
- 运动估计（ME）‍：在参考帧中搜索与当前块最相似的块，得到对应的 MV。
- 运动补偿（MC）‍：利用 MV 将参考块搬移到当前块位置，生成预测图像；随后对预测误差（残差）进行变换、量化和熵编码。
- 压缩效率：通过只传输 MV（或其差分 MVD）和残差，能够大幅削减帧间冗余，实现高效压缩。
精度与子像素插值
- 早期标准（如 MPEG‑4）采用 半像素（½ pixel）精度。
- H.264/AVC 将精度提升到 四分之一像素（¼ pixel），显著提升编码效率。
- HEVC、VVC 等后续标准继续沿用 ¼ pixel，并在部分实现中支持更高的 1/8 pixel 插值，以进一步改善低比特率下的画质。
运动向量的预测与差分编码
- 为降低 MV 本身的码率，编码器会根据已编码相邻块的 MV 进行预测（如左上、上方、右上三个块的中值预测），得到预测向量 MVP。
- 实际 MV 与 MVP 的差值（MVD）再进行可变长度或熵编码（CAVLC/CABAC），实现更紧凑的比特分配。
常见的搜索算法
- 全搜索（Full Search）‍、三步搜索（Three‑Step Search）‍、钻石搜索（Diamond Search）‍、六边形搜索（Hexagon Search）‍ 等在不同复杂度/性能需求下使用。
- 这些算法在整数像素层面确定最佳 MV，然后在子像素层面进行细化（FME），如 ¼ pixel 插值。
在图形渲染中的扩展应用
- 运动模糊（Motion Blur）‍：渲染管线记录每个像素的屏幕空间运动向量，用于在后处理阶段生成自然的运动模糊效果。
- 时间性抗锯齿（TAA）‍：利用历史帧的运动向量对像素进行重投影，平滑高频噪声，提升画面稳定性。
- 这些技术在实时渲染（如游戏引擎 HDRP）中广泛使用，原理与视频编码的 MV 类似，只是用途从压缩转向视觉效果。
标准化与发展趋势
- H.264/AVC：采用 ¼ pixel MV、4×4~16×16 可变块大小、CABAC/CAVLC 编码。
- HEVC/H.265：块大小扩大至 64×64，继续使用 ¼ pixel MV，并引入更高效的预测模式。
- VVC：在 MV 预测、子像素插值和熵编码上进一步优化，以适应 4K/8K 超高清视频需求。
小结
运动向量是连接相邻视频帧的“位移桥梁”。它通过运动估计找出块级对应关系，用运动补偿生成预测图像，再通过差分编码实现高效压缩；在图形渲染中，它又被用来记录像素运动轨迹，支撑运动模糊和时间性抗锯齿等视觉效果。随着视频分辨率和实时渲染需求的提升，MV 的精度、预测算法和硬件实现仍在持续演进。

Motion Vector 运动向量

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

什么是运动向量（Motion Vector）

什么是运动补偿（Motion Compensation）

什么是SPyNet（Spatial‑Pyramid‑Network）