目标检测中两阶段（R-CNN）与单阶段（YOLO）有何区别？

Question 1

Accepted Answer

两阶段（Two-stage，R-CNN 家族） 流程分两步：先由 RPN 等生成一批候选区域，再对每个候选框做分类和边框回归。代表：R-CNN → Fast R-CNN → Faster R-CNN。 - 优点：定位/分类精度高，对小目标和复杂场景更稳。 - 缺点：流程多、计算量大、速度较慢。 单阶段（One-stage，YOLO/SSD） 把检测当作一次回归：单次前向就在特征图网格/anchor 上同时预测类别与边框。 - 优点：快，端到端简单，适合实时（视频、边缘）。 - 缺点：早期版本对小目标、密集目标精度略逊；新版 YOLO 已大幅缩小与两阶段的精度差距。 共性组件 - NMS（非极大值抑制）：去除同一目标的重叠冗余框。 - IoU（交并比）：衡量预测框与真值框重叠度，是匹配与评估的基础。 - mAP：按不同 IoU 阈值综合各类别 AP，是主流评测指标。 选型：要极致精度、可接受延迟 → 两阶段；要实时/低延迟 → 单阶段。详见 目标检测：从 R-CNN 到 YOLO。

Question 2

NMS 是做什么的？有什么改进版本？

Accepted Answer

NMS 对同一类别的检测框按置信度排序，逐个保留最高分框并抑制与之 IoU 超阈值的其他框，消除重复检测。改进有 Soft-NMS（降权而非直接删）、DIoU-NMS（考虑中心距离）等，缓解密集目标被误抑制。

Question 3

mAP 是怎么计算的？

Accepted Answer

先按某 IoU 阈值判定每个预测为 TP/FP，对每个类别计算 PR 曲线下面积得到 AP，再对所有类别取平均得 mAP。COCO 指标对 IoU 从 0.5 到 0.95 多个阈值再求平均（mAP@[.5:.95]），更严格。

目标检测中两阶段（R-CNN）与单阶段（YOLO）有何区别？

核心要点

标准回答

常见误区

追问

延伸学习