
一、从产线误检说起上周产线反馈了个诡异问题:我们的YOLOv5模型在检测电子元件时,电阻电容的检出率接近99%,但某款特殊芯片的漏检率高达40%。查了训练数据才发现,数据集中电阻样本8万张,那个特殊芯片只有800张——典型的类别不平衡。损失函数在优化时被主流类别“绑架”了,模型干脆对少数类“视而不见”。这种问题在工业场景太常见了:缺陷样本远少于正常样本、新品类数据不足、长尾分布……今天我们就聊聊实战中处理类别不平衡的几种核心手段,重点讲Focal Loss和在线难例挖掘(OHEM)怎么用、怎么调、怎么避坑。二、Focal Loss:不只是加个权重那么简单Focal Loss的原始论文讲得很清楚,但直接照搬公式大概率会翻车。先看它的核心代码实现(PyTorch版):classFocalLoss(nn.Module):def