什么是Selective Search

AI解读 2小时前 硕雀
2 0

Selective Search(选择性搜索)概述

Selective Search 是一种用于目标检测的 区域提议(region proposal)‍ 算法,旨在从图像中自动生成可能包含目标的候选框(bounding box),从而大幅降低后续检测网络需要遍历的搜索空间。它通过 图像分割 + 区域合并 的方式,兼顾 多尺度覆盖 与 候选框多样性,在早期的 R‑CNN 系列中发挥了关键作用。


1. 工作原理与关键步骤

步骤 主要操作 关键要点
① 初始过分割 使用 Felzenszwalb‑Huttenlocher(FH)或 SLIC 等超像素分割算法,将图像划分为数百到上千个小区域(超像素) 目标是产生细粒度的初始块,保证后续合并的细节保留。
特征提取 对每个超像素计算 颜色直方图、纹理(如 LBP)‍、大小空间填充率 等特征 这些特征用于衡量相邻区域的相似度。
③ 相似度度量 采用四个兼容性指标:
① 颜色相似度
② 纹理相似度
③ 大小相似度
④ 空间填充率相似度
四者线性加权得到总体相似度
兼容性越高的区域更可能属于同一目标。
④ 贪心合并 在所有相邻区域中挑选相似度最高的一对进行合并,生成更大的区域;合并后重新计算该区域与其邻居的相似度,重复迭代直至只剩一个区域 形成 层次化分割,每一次合并都产生一个候选框。
⑤ 候选框收集 将每一次合并产生的区域(包括初始超像素)记录为候选框,最终得到 数千到上万 个提议。可根据需求选择 Fast(少量、快速)或 Quality(更多、召回率高)模式 Fast 约 2000‑3000 框,计算快;Quality 约 20000 框,召回率更高。

2. 主要优势

  1. 高召回率:能够捕获不同尺度、不同形状的目标,平均最高重叠率(MABO)在 VOC、COCO 等数据集上显著优于滑动窗口方法。
  2. 多样性:通过多种颜色空间、不同相似度度量以及不同初始分割阈值,生成的候选框在位置、尺度上高度多样化。
  3. 无需学习:算法基于手工特征和贪心合并,无需额外训练数据,易于在新数据集上直接使用。

3. 局限性

限制 说明
计算开销大:层次合并过程涉及大量相邻区域相似度计算,单张图像的运行时间通常在 1–2 秒CPU)甚至更高,难以满足实时需求。
候选框数量多:Quality 模式下会产生上万框,后续检测网络需要对大量框进行特征提取,导致整体检测速度受限。
对纹理/颜色相似的背景易产生误检:在颜色、纹理相近的背景区域也可能被合并为候选框,增加误报率

4. 应用与发展

  • R‑CNN 系列:Selective Search 为 R‑CNN、Fast R‑CNN、SPP‑Net 等提供高质量的候选框,是这些模型取得突破的关键前置步骤。
  • 后续改进:由于计算瓶颈,后续出现了 Region Proposal Network (RPN)(Faster R‑CNN)等端到端学习式提议方法,显著提升了速度和精度。但在需要 可解释性 或 无监督提议 的场景下,Selective Search 仍是重要的基准。
  • 跨领域使用:除了通用目标检测,Selective Search 也被用于 自动驾驶医学影像视频分析 等需要先定位感兴趣区域的任务中。

5. 实际使用示例(Python / OpenCV

import cv2

img = cv2.imread('image.jpg')
ss = cv2.ximgproc.segmentation.createSelectiveSearchSegmentation()
ss.setBaseImage(img)
ss.switchToSelectiveSearchFast()   # 或 switchToSelectiveSearchQuality()
rects = ss.process()               # rects 为 (x, y, w, h) 列表
for (x, y, w, h) in rects[:2000]: # 只取前 2000 个提议示例
    cv2.rectangle(img, (x, y), (x+w, y+h), (0,255,0), 1)
cv2.imwrite('ss_result.jpg', img)

上述代码展示了 OpenCV 中的快速调用方式,能够在几秒内得到数千个候选框,便于后续的 CNN 特征提取。


6. 小结

Selective Search 通过 超像素分割 + 基于颜色/纹理/大小/空间的相似度合并,在保持高召回率的同时提供了多尺度、多样性的候选框。它在早期深度目标检测体系中扮演了桥梁角色,尽管计算成本较高,但仍是评估新提议方法的经典基准,并在某些对可解释性或无监督需求的场景中保持价值。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!