089、农业病虫害检测:复杂背景下小目标农业害虫检测的数据增强与模型改进一、从一次田间调试说起去年夏天,我在广西某柑橘园部署YOLOv8检测模型,目标是识别早期蚜虫和红蜘蛛。现场拍回来的图像让我直接傻眼——叶片上的蚜虫只有十几个像素,背景是斑驳的阳光、泥土和枯叶,模型在实验室跑mAP有0.78,到了田间直接掉到0.23。更离谱的是,模型把很多枯叶上的斑点误检成害虫,而真正的害虫因为太小、对比度低,直接被忽略了。那次调试让我意识到,农业害虫检测的难点根本不是模型结构不够强,而是数据层面和训练策略的适配出了问题。后来我花了三周时间,从数据增强到模型改进,把mAP从0.23拉到了0.71。今天就把这些踩过的坑和最终方案拆开来讲。二、数据增强:别再用ImageNet那套了很多人做农业检测,直接套用YOLO默认的Mosaic和MixUp,结果发现效果反而变差。为什么?因为农业害虫图像有很强的领域特性:害虫尺寸极小(通常小于32×32像素)、背景纹理复杂、光照变化剧烈。默认的Mosaic会把四张图拼在一起,小目标被进一步缩小,模型根本学不到有效特征。2.1 小目标专用的Copy-Paste增强我最终采用的方案是基于实例分割的Copy-Paste,但做了两个关键改动:第一,只复制小目标,不复制大目标。写代码时我加了一个尺寸过滤:只有目标框