
060、迁移学习最佳实践:COCO 预训练权重在不同场景的微调策略对比上周帮同事调一个工业缺陷检测模型,他直接用YOLOv8的COCO预训练权重在钢表面划痕数据集上训了200个epoch,mAP卡在0.45死活上不去。我一看他的配置文件,学习率设成0.01,backbone全部冻结,数据增强只开了个随机翻转——典型的“拿COCO当万能药”思维。后来改成分层微调+余弦退火,同样的epoch数mAP直接跳到0.72。这个案例让我决定把这两年踩过的迁移学习坑系统梳理一下。为什么COCO预训练权重不是银弹COCO有80类、33万张图,场景覆盖日常物体、人物、动物。但你的业务场景可能是卫星遥感、医疗内镜、工业质检——这些领域的视觉特征和COCO差异巨大。预训练权重提供的是“通用视觉特征提取能力”,比如边缘、纹理、形状基元,而不是“特定场景语义理解”。我见过最离谱的做法是有人把COCO权重直接用在X光胸片检测上,结果模型把肋骨误检成“人”——因为COCO里“人”的骨架特征和肋骨在梯度上产生了共振。场景一:强相似域迁移(比如从COCO到自动驾驶)如果你的目标场景和COCO在视觉分布上重叠度高(比如车辆、行人、交通标志),微调策略可以激进一些。推荐配置:冻结backbone前3个stage,只微调stage4+head初始学习率设为COCO训练时的1/10(YOLOv8默认0.01,这里用0.001)