YOLOv5-6.1 单通道图像训练保姆级教程：从修改代码到成功导出ONNX模型

张

张建站

2026/5/19 23:45:10

10分钟阅读

YOLOv5-6.1 单通道图像训练保姆级教程：从修改代码到成功导出ONNX模型

YOLOv5-6.1 单通道图像训练全流程实战指南在工业质检、医学影像分析等专业场景中灰度图像处理往往比RGB三通道图像更具实际意义。本文将手把手带你完成YOLOv5-6.1框架的单通道适配改造从代码修改到模型导出覆盖90%开发者会遇到的典型报错场景。不同于零散的代码片段分享我们特别整理了全链路修改清单与报错解决方案对照表确保即使没有深度学习经验的工程师也能顺利完成项目部署。1. 环境准备与项目初始化1.1 基础环境配置推荐使用Python 3.8和PyTorch 1.8的组合这是经过验证与YOLOv5-6.1兼容性最好的版本环境。使用conda创建隔离环境conda create -n yolov5_mono python3.8 conda activate yolov5_mono pip install torch1.8.0cu111 torchvision0.9.0cu111 -f https://download.pytorch.org/whl/torch_stable.html克隆官方仓库时建议指定6.1版本分支git clone -b v6.1 https://github.com/ultralytics/yolov5.git cd yolov5 pip install -r requirements.txt1.2 数据集结构调整单通道训练数据集需要特殊处理目录结构。建议采用如下组织形式dataset_mono/ ├── images/ │ ├── train/ │ │ ├── image1.png │ │ └── image2.png │ └── val/ │ ├── image3.png │ └── image4.png └── labels/ ├── train/ │ ├── image1.txt │ └── image2.txt └── val/ ├── image3.txt └── image4.txt注意所有图像文件需统一为单通道格式如PNG灰度图避免混合通道数导致训练异常2. 核心代码修改全解析2.1 训练入口文件改造train.py需要修改三处关键配置默认通道数设置约第440行parser.add_argument(--channels, typeint, default1, helpnumber of input channels)模型初始化部分约第480行model Model(opt.cfg, ch1, ncnc, anchorshyp.get(anchors)).to(device) # 修改ch3为ch1数据加载参数传递train_loader, dataset create_dataloader(train_path, imgsz, batch_size // WORLD_SIZE, gs, opt, hyphyp, augmentTrue, cacheopt.cache, rectopt.rect, workersopt.workers, image_weightsopt.image_weights, quadopt.quad, prefixcolorstr(train: ), shuffleTrue, channels1) # 新增channels参数2.2 数据集加载逻辑重构utils/datasets.py需要系统性改造图像读取方式修改约第150行img cv2.imread(path, cv2.IMREAD_GRAYSCALE) # 替换原cv2.imread(path)通道维度处理约第180行if len(img.shape) 2: img np.expand_dims(img, axis2) # 灰度图增加通道维度移除HSV增强约第220行# 注释掉以下HSV增强代码块 # if random.random() hgain: # augment_hsv(img, hgainhgain, sgainsgain, vgainvgain)2.3 模型架构适配调整models/yolo.py和models/common.py需要协同修改输入通道验证common.py约第320行if im.mode ! L: im im.convert(L) # 强制转换为灰度模式卷积层权重校验yolo.py约第40行def __init__(self, cfgyolov5s.yaml, ch1, ncNone, anchorsNone): # 修改默认ch3为ch1特征图处理yolo.py约第120行if m.f -1: # 当来自上一层时 m.f i - 1 # 修改特征图索引 m.in_channels 1 # 单通道输入3. 典型报错与解决方案3.1 通道维度不匹配问题错误现象RuntimeError: Given groups1, weight of size [32, 3, 6, 6], expected input[8, 1, 640, 640] to have 3 channels解决步骤检查train.py中的--cfg参数是否指向正确配置文件确认models/yolov5s.yaml中nc和ch参数验证数据集加载是否真正输出单通道图像3.2 多线程加载异常错误现象AttributeError: NoneType object has no attribute python_exit_status解决方案修改train.py中workers参数parser.add_argument(--workers, typeint, default0, helpmaximum number of dataloader workers)添加环境变量在文件开头插入import os os.environ[KMP_DUPLICATE_LIB_OK]True3.3 显存不足处理当遇到CUDA out of memory时可通过以下策略缓解策略参数调整效果预估减小batch size--batch-size 16 → 8显存占用减半降低分辨率--imgsz 640 → 320显存需求降为1/4使用梯度累积--accumulate 2等效batch减半4. ONNX模型导出实战4.1 导出参数配置修改export.py关键参数# 第457行附近修改 torch.onnx.export(model, im, f, verboseFalse, opset_version12, input_names[images], output_names[output], dynamic_axes{images: {0: batch}, # batch size可变 output: {0: batch}} if opt.dynamic else None, trainingtorch.onnx.TrainingMode.EVAL, do_constant_foldingTrue, export_paramsTrue, keep_initializers_as_inputsFalse, channels1) # 新增单通道声明4.2 导出验证脚本使用以下代码验证ONNX模型import onnxruntime as ort import numpy as np sess ort.InferenceSession(yolov5s_mono.onnx) input_name sess.get_inputs()[0].name output_name sess.get_outputs()[0].name # 生成单通道测试数据 test_img np.random.rand(1, 1, 640, 640).astype(np.float32) pred sess.run([output_name], {input_name: test_img}) print(pred[0].shape) # 应输出(1, 25200, 85)4.3 部署优化建议量化压缩使用ONNX Runtime的量化工具减小模型体积python -m onnxruntime.tools.convert_onnx_models_to_ort yolov5s_mono.onnx多后端支持测试不同推理引擎的兼容性# TensorRT测试 import tensorrt as trt性能对比记录各平台推理耗时硬件平台输入尺寸平均时延(ms)CPU i7-11800H640x640120RTX 3060640x64015Jetson Xavier320x32045

从Wi-Fi信号变弱到高速PCB设计：S参数S21插入损耗到底在说什么？

从Wi-Fi信号变弱到高速PCB设计：S参数S21插入损耗到底在说什么？ 你有没有遇到过这样的场景：在客厅刷视频流畅无比，走到卧室却卡成PPT？或者精心设计的STM32板子，USB传输总是时快时慢？这些看似毫不…...

2026/5/19 23:44:19 阅读更多 →

ESP32-S3开发板Arduino环境搭建与I2C、SD卡外设应用实战

1. 项目概述与核心价值如果你刚拿到一块ESP32-S3开发板，面对一堆引脚和陌生的术语，可能会有点无从下手。这很正常，我刚开始玩嵌入式开发时也是这种感觉。微控制器（MCU）的世界，核心就是“控制”——通过编写…...

2026/5/19 23:42:32 阅读更多 →

避坑指南：在Ubuntu 22.04上用Anaconda配置Vision-Mamba环境，解决‘bimamba_type‘报错

深度避坑：Ubuntu 22.04下Vision-Mamba环境配置全攻略在深度学习项目部署过程中，环境配置往往是第一个拦路虎。最近在配置Vision-Mamba环境时，我遇到了几个令人头疼的问题，特别是那个让人摸不着头脑的bimamba_type报错。经过一番折…...

2026/5/19 23:41:44 阅读更多 →

Windows隐藏COM端口清理指南：解决端口号膨胀问题

1. 项目概述：为什么你的COM端口号会“膨胀”到两位数？如果你是一位长期在Windows系统下进行嵌入式开发、单片机调试，或者经常使用USB转串口工具的朋友，大概率遇到过这个令人头疼的现象：设备管理器里的COM端口号&#x…...

2026/5/18 8:51:59 阅读更多 →

Playnite完整指南：高效统一你的跨平台游戏库管理体验

Playnite完整指南：高效统一你的跨平台游戏库管理体验【免费下载链接】Playnite Video game library manager with support for wide range of 3rd party libraries and game emulation support, providing one unified interface for your games. 项目地址: http…...

2026/5/18 8:52:11 阅读更多 →