核心要点

  • 先按置信度从高到低排序所有候选框。

  • 取出当前最高分框保留,计算它与其余框的 IoU

  • 抑制(剔除)IoU 大于阈值的框,对剩余框重复上述过程直到为空。

  • 易错点:IoU 中交集宽高需与 0 取 max 防止负值;保留索引顺序对应原框。

标准回答

非极大值抑制用于去除目标检测中同一物体的重叠冗余框。核心思路是贪心:先按分数降序排列,每次取出分数最高的框作为保留结果,再计算它与剩余所有框的交并比 IoU,把 IoU 超过阈值的框视为重复检测并剔除;对剩下的框重复该过程,直到没有候选框。计算 IoU 时交集区域的宽高要与 0 取最大值,避免不相交时出现负面积。下面用 NumPy 向量化实现:

python
import numpy as np

def nms(boxes, scores, iou_thr=0.5):
    # boxes: (N, 4) 每行 [x1, y1, x2, y2];scores: (N,)
    x1, y1, x2, y2 = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
    areas = (x2 - x1) * (y2 - y1)
    order = scores.argsort()[::-1]   # 分数从高到低的索引
    keep = []
    while order.size > 0:
        i = order[0]                 # 当前最高分框
        keep.append(i)
        # 计算 i 与其余框的交集
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])
        w = np.maximum(0.0, xx2 - xx1)   # 与 0 取 max 防负
        h = np.maximum(0.0, yy2 - yy1)
        inter = w * h
        iou = inter / (areas[i] + areas[order[1:]] - inter)
        # 仅保留 IoU 不超过阈值的框,进入下一轮
        order = order[1:][iou <= iou_thr]
    return keep

if __name__ == '__main__':
    boxes = np.array([[0,0,10,10],[1,1,11,11],[20,20,30,30]], dtype=float)
    scores = np.array([0.9, 0.8, 0.7])
    print(nms(boxes, scores, 0.5))  # [0, 2],框1 被框0 抑制

常见误区

⚠️ 常见踩坑

IoU 分母应为「并集 = 两框面积之和 − 交集」,写成单框面积或漏减交集会算错;交集宽高不与 0 取 max 时,不相交的框会得到虚假的正交集。

追问

追问 1复杂度是多少?如何优化?

朴素实现每轮抑制一批框,最坏 O(N²)(N 为框数),排序为 O(N log N)。可用 GPU 批量计算 IoU 并行化;类别很多时应按类别分组分别做 NMS;工程上还有 Soft-NMS(不直接删除而是衰减重叠框分数)减少漏检密集目标。

追问 2NMS 在密集/遮挡场景有什么问题,如何缓解?

硬阈值 NMS 会把真实但高度重叠的相邻物体误删,造成漏检。Soft-NMS 用与 IoU 相关的权重衰减分数而非直接剔除;此外可用 DIoU-NMS 引入中心距离、或改用端到端的 DETR 类无 NMS 检测器。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。