
YOLOv10:NMS-free 双分配与端到端延迟优化1. 为什么 YOLO 需要一次"手术"1.1.1.1 NMS 是谁,它带来了什么麻烦我们先想象一个拥挤的十字路口。目标检测模型就像一位摄影师,试图给每一个行人框出一个矩形边框。问题是,这位摄影师有点"手抖"——同一个行人,它可能会连续按下快门三次,产生三个高度重叠的边框。这时候就需要一位"后期编辑",把重复的照片删掉,只保留最好的一张。这位后期编辑就是 NMS(Non-Maximum Suppression,非极大值抑制)。听起来很合理对吧?但问题在于,这位后期编辑做事太慢了。在自动驾驶或工业质检的流水线上,每一帧图像都要等 NMS 把重复边框筛完,才能输出最终结果。这个等待时间可能只占几十毫秒,但在实时视频流里,它就成了整个流水线的天花板。更麻烦的是,NMS 有一堆超参数——置信度阈值、IoU 阈值——这些参数在不同数据集上需要反复调优,让部署工程师头疼不已。1.1.1.2 从"后期编辑"到"一次成片"我们能不能让摄影师直接练就"一次成片"的本领?也就是说,在按下快门的那一刻,模型就已经确定:这个行人我只框一次,绝不重复。这就是 YOLOv10 的核心诉求——NMS-free。听起来抽象对吧?别急,我们先从一张 4×4 的小网格说起,看看"重复预测"到底是怎么产生的,再一步步推广到真实尺度。2.