怎么看,分别表示什么?)
一、先明确核心分类这些文件是 YOLO 训练的「全维度评估 过程可视化」结果按功能分为 4 类以 NG/OK 二分类场景逐一解释新手友好避开复杂公式 第一类模型性能核心评估曲线Box/Mask 开头的 PNG这类是判断模型检测效果好坏的核心指标你的场景重点看「Box 开头」目标检测框评估Mask 开头是实例分割评估若你只做检测可忽略。文件名核心含义通俗版怎么看你的 NG/OK 场景BoxF1_curve.pngF1 曲线模型 “精准度 召回率” 的综合得分曲线曲线越靠近右上角、数值越高F1 最大值越接近 1→ 模型对 NG/OK 的检测综合效果越好横坐标是置信度阈值纵坐标是 F1 值找峰值对应的阈值比如 0.35可设为 X-AnyLabeling 的 conf_thresholdBoxP_curve.pngP 曲线精准度曲线模型 “标对的 NG/OK” 占 “所有标注 NG/OK” 的比例曲线越平稳、数值越高 → 模型很少把 OK 标成 NG减少误检比如曲线全程0.9 → 误检率10%适合工业检测避免漏检 / 误判BoxR_curve.pngR 曲线召回率曲线模型 “找全的 NG/OK” 占 “实际所有 NG/OK” 的比例曲线越靠近 1、下降越慢 → 模型很少漏标 NG工业检测核心漏检 NG 会导致次品流出理想状态召回率0.95漏检率5%BoxPR_curve.pngPR 曲线精准度 - 召回率曲线P 和 R 的联动关系曲线包围的面积AP 值越大越好 → 代表模型在不同置信度下精准度和召回率都优秀二分类场景中AP0.9 就是效果很好的模型补充F1 2×(精准度 × 召回率)/(精准度 召回率)是工业检测的核心指标兼顾 “不标错” 和 “不漏标”。 第二类错误分析核心 —— 混淆矩阵confusion_matrix 相关 PNG这类是直观看模型分类错误的分布对你的 NG/OK 二分类场景最易理解文件名核心含义通俗版怎么看你的场景confusion_matrix.png混淆矩阵原始图行 真实类别列 预测类别二分类场景下矩阵是 2×2✅ 对角线左上→右下数值越高 → 模型分类越准真实 NG 预测为 NG、真实 OK 预测为 OK❌ 非对角线数值0 → 有错误比如真实 NG 预测为 OK 漏检真实 OK 预测为 NG 误检confusion_matrix_normalized.png归一化混淆矩阵数值是百分比更易对比比如 “真实 NG→预测 OK” 占比 2% → 漏检率 2%“真实 OK→预测 NG” 占比 1% → 误检率 1%工业场景建议漏检率5%、误检率3% 第三类训练过程可视化train_batch/val_batch 开头的 JPG这类是直观看模型训练时的 “学习效果”能快速发现数据 / 标注问题文件名核心含义通俗版怎么看你的场景train_batch0/1/2.jpg训练集批次图片模型训练时看到的图片 预测框看红色框预测框是否和蓝色框真实标注框重合✅ 重合度高 → 模型学到位了❌ 预测框跑偏 / 漏框 → 可能是标注不准、图片模糊、类别混淆train_batch13590/13591.jpg训练后期批次图片对比前期batch0和后期batch13590后期预测框更准 → 模型收敛正常若后期仍跑偏 → 需增加训练轮数 / 调整数据val_batch0_labels.jpg验证集真实标注验证集图片的原始标注框作为对比基准看标注是否规范比如 NG/OK 标注框是否统一val_batch0_pred.jpg验证集预测结果模型在验证集的预测框对比 val_batch0_labels.jpg → 预测框和真实框重合度越高 → 模型泛化能力越好能识别没见过的图片 第四类配置 / 结果文件args.yaml、results.csv、settings.json 等这类是训练参数 数值化结果用于复盘训练过程文件名核心含义通俗版怎么看你的场景args.yaml训练参数配置记录你训练时的所有参数批次、轮数、学习率、模型版本等比如看epochs: 100训练轮数、imgsz: 640输入尺寸、classes: 2类别数→ 确认参数和你设置的一致若模型效果差可调整学习率 / 轮数results.csv数值化结果每轮训练的损失值、P/R/F1/AP 等指标用 Excel 打开看 F1/AP 列是否持续上升最后趋于平稳 → 模型收敛若指标波动大 → 数据量不足 / 标注噪声大settings.json训练环境配置记录训练时的硬件、软件版本比如 CUDA 版本、YOLO 版本排查环境问题比如版本不兼容导致训练异常weights 文件夹训练产出的权重文件包含 best.pt最优权重、last.pt最后一轮权重✅ 优先用 best.pt 导出 ONNX效果最好last.pt 是训练结束的权重若后期过拟合效果不如 best.ptlabels.jpg标注分布可视化展示训练集中 NG/OK 的数量、位置分布看 NG/OK 数量是否均衡比如 NG:OK1:10 也可但不要 1:1000若某类标注极少 → 模型学不会需补充数据二、新手快速看结果的「3 步核心法」你的 NG/OK 场景先看混淆矩阵确认漏检率NG→OK和误检率OK→NG是否在可接受范围工业场景5%再看 BoxF1_curve.pngF1 峰值是否0.9 → 综合效果达标最后看 val_batch0_pred.jpg验证集预测框是否精准覆盖 NG/OK 目标 → 泛化能力达标。三、总结类型核心作用你的 NG/OK 场景重点关注评估曲线Box 开头量化模型检测精度 / 召回率F1 曲线峰值、PR 曲线面积混淆矩阵分析漏检 / 误检分布非对角线数值漏检率 / 误检率训练 / 验证批次图直观看模型学习效果预测框与真实框的重合度配置 / 权重文件复盘训练参数、导出可用模型args.yaml参数、weights/best.pt最优权重按这个逻辑你能快速判断模型是否达标若漏检率 / 误检率低、F1 值高、验证集预测准就可以用 best.pt 导出 ONNX放到 X-AnyLabeling 里使用若效果差可补充 NG/OK 标注数据、调整训练轮数 / 学习率后重新训练。