什么是图割(Graph Cuts)

AI解读 2小时前 硕雀
2 0

图割Graph Cuts)概述

图割是一类基于图论的全局优化技术,最核心的思想是把图像(或更一般的离散数据)建模为带权无向图,然后通过求解该图的最小割(minimum cut)‍来实现分割、标记或其他离散化任务。它把原本的高维能量最小化问题转化为最大流‑最小割问题,从而可以利用成熟的网络流算法在多项实际应用中获得高效且全局最优(或近似全局最优)的解。


1. 基本原理与图的构造

元素 含义 说明
节点(Vertex) 图像中的像素或超像素 每个像素对应图中的一个普通节点 V
边(Edge) 连接相邻像素的连通关系 分为 n‑links(相邻像素之间)和 t‑links(普通节点与源/汇)
源点 S / 汇点 T 两个特殊的终端节点 S 代表前景(foreground),T 代表背景(background)
边权(Weight) 表示割的代价 n‑links 权重体现像素相似度(平滑项),t‑links 权重体现像素属于前景/背景的概率(数据项)

构造完成后,指的是把图划分为两部分,使得 S 与 T 被分离,割的代价等于被切断的所有边权之和。最小割即代价最小的划分,对应于能量函数的最小化解。


2. 能量函数与优化目标

典型的图割能量函数由两部分组成:

  • 数据项 :衡量像素  被标记为前景或背景的代价,通常由颜色直方图高斯混合模型深度学习预测得到。
  • 平滑项 :鼓励相邻像素拥有相同标签,权重与像素强度差异、梯度等相关 。

将上述能量映射到图的边权后,最小割即为能量最小化的解。


3. 求解算法

  1. 最大流‑最小割算法
    • Ford‑FulkersonEdmonds‑Karp(基于增广路径
    • Push‑relabel(推送‑重标记)
  2. Boykov‑Kolmogorov (BK) 算法
    • 1999 年提出,专为图像分割优化,利用 增广路径 与 残余图 的高效更新,在实际图像尺寸上表现尤佳,成为工业界和学术界的主流实现。
  3. 多标签扩展
    • α‑expansionα‑β swap:将多标签问题转化为一系列二标签图割,逐步逼近全局最优。
  4. 动态图割
    • 对视频或交互式分割,利用上一次割的残余图快速更新,显著提升实时性。

4. 典型应用

领域 具体任务 说明
图像分割 前景/背景分离、交互式分割(GrabCut) 通过用户提供的种子点(seed)构建 t‑links,实现自动或半自动分割
立体匹配 视差估计 将视差标签视为图割的多标签变量,使用 α‑expansion 优化能量,得到稠密视差图
图像抠图 / Matting 前景提取 结合颜色模型与边缘信息,构造图割实现高质量抠图
医学影像 器官或病灶分割 在 CT/MRI 上构建基于强度和解剖先验的图割,提升分割准确率
视频分割 动态前景/背景分离 使用动态图割快速更新,保持帧间连贯性
其他 纹理合成、图像修复、超像素生成等 通过能量模型的不同设计,图割可推广到多种离散优化任务

5. 优势与局限

优势

  • 全局最优(或近似全局最优)‍:相较于局部迭代方法(如梯度下降),图割能避免局部陷阱。
  • 数学理论成熟:最大流‑最小割定理提供了严谨的最优性保证。
  • 实现高效:BK、Push‑relabel 等专用实现已在 CPU/GPU 上高度优化。

局限

  • 二值化倾向:基本图割只能处理二标签,需要 α‑expansion 等扩展才能处理多标签。
  • 对能量函数依赖强:若数据项或平滑项设计不当,分割质量会显著下降。
  • 计算资源:在超大规模 3D/4D 数据上仍需大量内存和计算时间,尽管动态图割有所缓解。

6. 最近发展(截至 2025)

  • 深度学习结合:利用 CNN/Transformer 预测的概率图作为图割的 t‑links 权重,实现 深度图割(Deep Graph Cuts)‍,在医学影像和自动驾驶中取得显著提升。
  • 实时交互式分割:基于 GPU 的并行 BK 实现,使得用户在几百毫秒内即可得到分割结果,广泛用于图像编辑软件。
  • 多模态图割:将 RGB、深度、红外等多源信息统一映射到同一图结构,提升在复杂场景下的鲁棒性

7. 小结

图割是一种把离散优化问题映射到图的最小割上求解的强大方法。通过构造合适的 节点、边、权重,并利用 最大流‑最小割 算法(尤其是 Boykov‑Kolmogorov 实现),可以在图像分割、立体匹配、医学影像等众多领域获得高质量、全局最优的解。近年来,深度学习的融合和硬件加速进一步扩展了图割的适用范围,使其在实时交互和多模态场景中保持竞争力。

(参考文献:①《Graph Cut》教程;② Boykov & Kolmogorov “Fast Approximate Energy Minimization via Graph Cuts”;③ 《Graph Cuts》技术概述;④ 2025 年 CSDN 图割最新综述;⑤ 《Graph Cuts 在计算机视觉中的应用》综述)

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!