核心要点
先按置信度从高到低排序所有候选框。
取出当前最高分框保留,计算它与其余框的 IoU。
抑制(剔除)IoU 大于阈值的框,对剩余框重复上述过程直到为空。
易错点:IoU 中交集宽高需与 0 取 max 防止负值;保留索引顺序对应原框。
标准回答
非极大值抑制用于去除目标检测中同一物体的重叠冗余框。核心思路是贪心:先按分数降序排列,每次取出分数最高的框作为保留结果,再计算它与剩余所有框的交并比 IoU,把 IoU 超过阈值的框视为重复检测并剔除;对剩下的框重复该过程,直到没有候选框。计算 IoU 时交集区域的宽高要与 0 取最大值,避免不相交时出现负面积。下面用 NumPy 向量化实现:
python
import numpy as np
def nms(boxes, scores, iou_thr=0.5):
# boxes: (N, 4) 每行 [x1, y1, x2, y2];scores: (N,)
x1, y1, x2, y2 = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
areas = (x2 - x1) * (y2 - y1)
order = scores.argsort()[::-1] # 分数从高到低的索引
keep = []
while order.size > 0:
i = order[0] # 当前最高分框
keep.append(i)
# 计算 i 与其余框的交集
xx1 = np.maximum(x1[i], x1[order[1:]])
yy1 = np.maximum(y1[i], y1[order[1:]])
xx2 = np.minimum(x2[i], x2[order[1:]])
yy2 = np.minimum(y2[i], y2[order[1:]])
w = np.maximum(0.0, xx2 - xx1) # 与 0 取 max 防负
h = np.maximum(0.0, yy2 - yy1)
inter = w * h
iou = inter / (areas[i] + areas[order[1:]] - inter)
# 仅保留 IoU 不超过阈值的框,进入下一轮
order = order[1:][iou <= iou_thr]
return keep
if __name__ == '__main__':
boxes = np.array([[0,0,10,10],[1,1,11,11],[20,20,30,30]], dtype=float)
scores = np.array([0.9, 0.8, 0.7])
print(nms(boxes, scores, 0.5)) # [0, 2],框1 被框0 抑制常见误区
⚠️ 常见踩坑
IoU 分母应为「并集 = 两框面积之和 − 交集」,写成单框面积或漏减交集会算错;交集宽高不与 0 取 max 时,不相交的框会得到虚假的正交集。
追问
追问 1:复杂度是多少?如何优化?
朴素实现每轮抑制一批框,最坏 O(N²)(N 为框数),排序为 O(N log N)。可用 GPU 批量计算 IoU 并行化;类别很多时应按类别分组分别做 NMS;工程上还有 Soft-NMS(不直接删除而是衰减重叠框分数)减少漏检密集目标。
追问 2:NMS 在密集/遮挡场景有什么问题,如何缓解?
硬阈值 NMS 会把真实但高度重叠的相邻物体误删,造成漏检。Soft-NMS 用与 IoU 相关的权重衰减分数而非直接剔除;此外可用 DIoU-NMS 引入中心距离、或改用端到端的 DETR 类无 NMS 检测器。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。