摘要本文基于10个工业视觉项目实战经验整理出YOLOv8最稳定的入门流程。全程无废话从conda环境创建、PyTorch安装、官方demo跑通到自己的数据集标注、模型训练、推理部署一步都不跳过。解决了版本不兼容、CUDA没装上、训练不收敛等90%的入门踩坑问题代码可直接复制运行新手也能30分钟内跑通第一个目标检测模型。前言几乎所有入门计算机视觉的人第一个接触的模型都是YOLO。但我见过太多人卡在第一步环境搭建踩坑3天版本不兼容CUDA装不上import ultralytics就报错好不容易跑通官方demo却不知道怎么用自己的数据集训练训练的时候显存爆炸、标签不匹配、损失不下降不知道哪里出问题网上的教程要么太老还在讲YOLOv5要么太散东拼西凑还是跑不起来。今天我把最稳定、最不容易踩坑的YOLOv8入门流程整理出来全程用最新的稳定版本代码直接复制就能运行。只要跟着步骤走30分钟内一定能跑通自己的第一个目标检测模型。一、整体流程概览环境搭建 (condaPyTorchultralytics)跑通官方预训练模型 (检测图片/视频/摄像头)自己的数据集准备 (LabelImg标注自动划分)模型训练 (自定义参数GPU加速)推理部署 (用训练好的模型检测)二、第一步环境搭建最容易踩坑的部分核心原则用固定的版本组合不要用最新版最新版往往有各种bug下面这个版本组合是我试了10次才找到的最稳定的亲测Windows/Linux/macOS都能用。2.1 安装Anaconda直接去官网下载最新版Anaconda安装的时候记得勾选“Add Anaconda to my PATH environment variable”省得后面手动配置环境变量。2.2 创建虚拟环境打开Anaconda Prompt执行以下命令# 创建虚拟环境指定Python 3.10最稳定的版本conda create-nyolopython3.10-y# 激活虚拟环境conda activate yolo2.3 安装PyTorch带CUDA这是最关键的一步如果装成CPU版训练速度会慢10倍以上。# 安装PyTorch 2.3 CUDA 11.8兼容绝大多数显卡pip3installtorch2.3.0torchvision0.18.0torchaudio2.3.0 --index-url https://download.pytorch.org/whl/cu118验证CUDA是否安装成功importtorchprint(torch.cuda.is_available())# 输出True就是成功print(torch.cuda.get_device_name(0))# 输出你的显卡型号2.4 安装ultralyticsYOLOv8官方库# 安装ultralytics 8.2.0最新稳定版pipinstallultralytics8.2.0验证YOLOv8是否安装成功fromultralyticsimportYOLO modelYOLO(yolov8n.pt)# 自动下载预训练权重print(YOLOv8安装成功)✅ 到这里环境就搭建完成了全程不到10分钟没有任何坑。三、第二步跑通官方预训练模型环境搭好后先跑通官方预训练模型感受一下YOLO的威力。代码只有3行直接复制运行。3.1 检测图片fromultralyticsimportYOLO# 加载预训练模型自动下载yolov8n.ptmodelYOLO(yolov8n.pt)# 检测图片resultsmodel(https://ultralytics.com/images/bus.jpg)# 保存结果results[0].save(bus_result.jpg)print(检测完成结果已保存为bus_result.jpg)运行后会在当前目录生成bus_result.jpg里面有检测到的人和公交车的框和标签。3.2 检测视频fromultralyticsimportYOLO modelYOLO(yolov8n.pt)# 检测视频resultsmodel(video.mp4,saveTrue)3.3 实时摄像头检测fromultralyticsimportYOLO modelYOLO(yolov8n.pt)# 实时摄像头检测0是默认摄像头resultsmodel(source0,showTrue)四、第三步用自己的数据集训练这是实战的核心也是大家最关心的部分。我会用最简单的方式教你怎么标注自己的数据集然后训练模型。4.1 数据集结构首先创建如下的文件夹结构my_dataset/ ├── images/ # 所有图片都放在这里 └── labels/ # 标注生成的txt文件会放在这里4.2 用LabelImg标注数据LabelImg是最常用的标注工具安装和使用都很简单# 安装LabelImgpipinstalllabelimg# 启动LabelImglabelimg标注步骤点击Open Dir选择my_dataset/images文件夹点击Change Save Dir选择my_dataset/labels文件夹点击Create RectBox用鼠标框出目标输入类别名称标注完一张后点击Save保存然后点击Next Image标注下一张。注意至少标注100张图片才能保证模型有基本的效果。4.3 自动划分数据集不用手动分train/val/testultralytics会自动帮你划分。在my_dataset目录下创建dataset.yaml文件# 数据集路径path:../my_dataset# 相对于训练代码的路径train:imagesval:imagestest:images# 类别数量nc:2# 类别名称names:0:cat1:dog4.4 训练模型创建train.py文件代码如下fromultralyticsimportYOLO# 加载预训练模型modelYOLO(yolov8n.pt)# 训练模型resultsmodel.train(datamy_dataset/dataset.yaml,# 数据集配置文件epochs50,# 训练轮次新手先设50batch8,# 批次大小根据显存调整显存小就设2/4imgsz640,# 输入图片尺寸device0,# 使用GPU 0CPU的话设为cpuprojectruns/train,# 训练结果保存路径namemy_model# 本次训练的名称)print(训练完成)运行train.py就开始训练了。训练过程中会显示损失、精度、召回率等指标训练完成后结果会保存在runs/train/my_model目录下。4.5 用训练好的模型推理训练完成后最好的模型是runs/train/my_model/weights/best.pt用它来推理fromultralyticsimportYOLO# 加载自己训练的模型modelYOLO(runs/train/my_model/weights/best.pt)# 检测图片resultsmodel(test.jpg,saveTrue)print(推理完成结果已保存)五、常见踩坑指南90%的人都会遇到5.1 CUDA没装上训练特别慢症状print(torch.cuda.is_available())输出False。解决方案检查你的显卡是否支持CUDANVIDIA显卡都支持AMD和Intel核显不支持卸载原来的PyTorch重新安装带CUDA的版本pip uninstall torch torchvision torchaudio-ypip3installtorch2.3.0torchvision0.18.0torchaudio2.3.0 --index-url https://download.pytorch.org/whl/cu1185.2 显存不足报错CUDA out of memory症状训练的时候报错“CUDA out of memory”。解决方案减小batch_size比如从8改成4或2减小imgsz比如从640改成416关闭其他占用显存的程序。5.3 标签不匹配训练不收敛症状训练的时候损失一直很高精度一直是0。解决方案检查dataset.yaml里的类别数量和类别名称是否和标注的一致检查标注的txt文件里的类别ID是否从0开始检查图片和标签的文件名是否一一对应。5.4 数据集路径错误症状报错“Dataset not found”。解决方案检查dataset.yaml里的path是否正确是相对于训练代码的路径不要用中文路径不要有空格。六、总结本文用最稳定的版本组合最详细的步骤教你30分钟内搞定YOLOv8从环境搭建到跑通自己的数据集。全程没有废话所有代码都经过实际验证新手也能轻松上手。核心要点回顾环境搭建用Python 3.10 PyTorch 2.3 CUDA 11.8 ultralytics 8.2.0最稳定官方demo3行代码就能检测图片、视频、摄像头自己的数据集用LabelImg标注自动划分数据集50个epoch就能得到不错的效果常见踩坑CUDA没装、显存不足、标签不匹配、路径错误。YOLO的入门其实很简单难的是后续的优化和部署。但只要跑通了第一个模型后面的学习就会顺利很多。动手试试吧你会发现计算机视觉其实没有想象中那么难。原创不易欢迎点赞收藏关注后续会更新YOLOv8模型压缩、C#部署、工业缺陷检测实战等教程