【YOLOv5 v6.1】从零到一：手把手实战自定义数据集训练与部署避坑指南-尧图网站设计

1. 环境准备从零搭建YOLOv5训练环境第一次接触YOLOv5时我最头疼的就是环境配置。这里分享一个经过多次验证的稳定方案适用于大多数NVIDIA显卡设备。首先需要安装Anaconda这是管理Python环境的利器。我习惯用Miniconda体积更小但功能完整wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh创建专属环境时特别注意Python版本要与PyTorch匹配。实测v6.1版本在Python 3.8上最稳定conda create -n yolov5 python3.8 conda activate yolov5安装PyTorch时最容易踩坑。建议先去PyTorch官网用他们的配置生成器根据你的CUDA版本生成安装命令。比如我的RTX 3080是CUDA 11.3pip install torch1.10.1cu113 torchvision0.11.2cu113 torchaudio0.10.1 -f https://download.pytorch.org/whl/cu113/torch_stable.html最后克隆YOLOv5仓库并安装依赖。注意要指定v6.1版本因为main分支可能已经更新git clone -b v6.1 https://github.com/ultralytics/yolov5.git cd yolov5 pip install -r requirements.txt验证安装是否成功时别急着跑训练先用这个小技巧测试import torch print(torch.cuda.is_available()) # 应该返回True print(torch.cuda.device_count()) # 显示可用GPU数量2. 数据准备制作高质量自定义数据集去年给工厂做零件检测项目时我深刻体会到数据质量决定模型上限。先说数据集结构YOLOv5需要这样的目录custom_dataset/ ├── images/ │ ├── train/ # 训练图片 │ └── val/ # 验证图片 └── labels/ ├── train/ # 训练标签 └── val/ # 验证标签标签格式是YOLO特色的归一化坐标每行一个对象格式为class_id x_center y_center width height比如标注一个位于图片正中央、占画面1/4大小的苹果class_id00 0.5 0.5 0.5 0.5推荐用LabelImg标注但要注意两点保存格式选YOLO而非PascalVOC类名文件要保存为dataset.yaml里的names顺序转换已有数据集时这个Python代码片段能把COCO格式转YOLOfrom pycocotools.coco import COCO import os coco COCO(annotations/instances_train2017.json) cat_ids coco.getCatIds() img_ids coco.getImgIds() for img_id in img_ids: img_info coco.loadImgs(img_id)[0] ann_ids coco.getAnnIds(imgIdsimg_id) anns coco.loadAnns(ann_ids) with open(flabels/{img_info[file_name].replace(.jpg,.txt)}, w) as f: for ann in anns: x,y,w,h ann[bbox] x_center (x w/2) / img_info[width] y_center (y h/2) / img_info[height] width w / img_info[width] height h / img_info[height] f.write(f{ann[category_id]-1} {x_center} {y_center} {width} {height}\n)3. 模型训练参数调优与性能监控启动训练前必须配置好dataset.yaml文件。这个文件就像菜谱告诉模型去哪找数据train: ../custom_dataset/images/train val: ../custom_dataset/images/val nc: 3 # 类别数 names: [apple, orange, banana] # 类别名称开始训练的命令看似简单但参数组合大有学问python train.py --img 640 --batch 16 --epochs 100 --data dataset.yaml --cfg models/yolov5s.yaml --weights yolov5s.pt几个关键参数经验值--img分辨率越大精度越高但显存占用呈平方增长。RTX 3090可以尝试12803060建议640--batch尽可能大但不要触发OOM。可用--batch-size自动寻找最大值--epochs简单数据集50-100足够复杂场景建议300监控训练进度时别只看loss曲线。我习惯同时关注这些指标mAP0.5:IOU常规检测精度mAP0.5:0.95严格指标各类别的precision/recall发现样本不均衡遇到显存不足时试试这些方法减小--batch-size使用--multi-scale开启多尺度训练添加--adam改用Adam优化器启用梯度累积--accumulate 24. 模型部署从检测到落地应用训练完成后best.pt就是你的成果。用detect.py测试时这些参数最实用python detect.py --weights runs/train/exp/weights/best.pt --source test_images/ --conf 0.5 --iou 0.45 --imgsz 640其中--conf是置信度阈值根据场景调整安防监控0.7-0.9减少误报工业质检0.3-0.6避免漏检部署到生产环境时我推荐用TorchScript导出import torch model torch.hub.load(ultralytics/yolov5, custom, pathbest.pt) model.eval() traced_model torch.jit.trace(model, torch.randn(1, 3, 640, 640)) traced_model.save(yolov5_custom.pt)在OpenCV中调用导出的模型import cv2 net cv2.dnn.readNetFromTorch(yolov5_custom.pt) blob cv2.dnn.blobFromImage(img, 1/255.0, (640,640), swapRBTrue) net.setInput(blob) outs net.forward()最后提醒几个部署时的坑输入图像预处理必须和训练时一致归一化、BGR/RGB不同框架的NMS实现可能有差异TensorRT加速时需要重新校准anchor

【YOLOv5 v6.1】从零到一：手把手实战自定义数据集训练与部署避坑指南

相关新闻

内核融合技术：优化AI推理的CPU-GPU协同

【实战解析】STC8H8K64U USB下载与最小系统搭建避坑指南

别再乱改Rime配置了！先搞懂用户文件夹和程序文件夹的区别（Windows/Ubuntu路径详解）

区块链跨链桥接：原理与实现

Python实战：基于奇异谱分析(SSA)的时序数据分解与重构

天龙八部单机版GM工具：5分钟快速上手指南与完整功能解析

从零到一：在Linux服务器上部署xrdp远程桌面服务

AI冲击下，Java程序员还能从哪些方面提升核心竞争力？

深入剖析Element-Plus Table组件fixed列滚动时样式错乱的底层原理与修复方案

Claude Code 在 AI Agent 项目上线阶段的 4 类运维问题与自动化迭代方案

m4s-converter：开源跨平台工具实现B站缓存视频无缝转换

保姆级教程：在Ubuntu 20.04上用kitti2bag工具把KITTI Raw Data转成ROS Bag（避坑实录）

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程