什么是Rectified Flow

AI解读 8小时前 硕雀
7 0

Rectified Flow矫正流)概述

Rectified Flow 是一种新兴的生成模型框架,核心思想是把数据分布和噪声分布之间的传输路径设计成尽可能直的轨迹。通过学习一个速度场(即在每个时刻应该往哪个方向移动),模型能够在极少的步数甚至一步完成从噪声到真实数据的转换,从而实现快速、简洁的生成过程。

关键特点

  1. 直线轨迹
    • 传统的扩散模型需要数百甚至上千步的逐步去噪,而 Rectified Flow 直接把起始分布和目标分布用一条直线相连,使采样过程大幅简化。
    • 这种设计让生成速度提升数十倍以上,同时保持高质量的生成效果。
  2. 基于常微分方程ODE
    • 模型把生成过程视为求解一个常微分方程的过程,学习的速度场在每个时间点指导样本沿直线前进。
    • 与需要随机微分方程SDE)的扩散模型不同,Rectified Flow 只依赖确定性的 ODE,概念更直观,实现更轻量。
  3. 矫正(Rectification)机制
    • 在训练阶段,模型先学习一个粗糙的线性映射,然后通过“重新流动”(reflow)步骤不断修正,使路径更加平直、误差更小。
    • 这种迭代式的矫正过程帮助模型在保持生成质量的同时进一步压缩采样步数。
  4. 灵活的起始分布
    • 与扩散模型必须从标准正态噪声开始不同,Rectified Flow 可以接受任意分布作为起点,甚至可以直接在两个真实数据分布之间进行迁移学习(如图像风格转换、跨域生成等)。
  5. 广泛的应用场景
    • 高分辨率图像生成、文本到图像/视频的生成、跨模态数据迁移、点云姿态估计等,都已经有基于 Rectified Flow 的实现或实验报告。

与其他生成模型的对比

模型 生成步骤 关键技术 主要优势
GAN 单步(对抗训练 对抗损失 生成速度快,但训练不稳定
扩散模型 上百步 随机微分方程 生成质量高,训练稳定
Rectified Flow 极少步(可一步) 常微分方程 + 矫正 兼具速度与质量,实现更简单

参考链接

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!