yolov5数据集_基于垃圾目标检测任务的YOLOv5初探

作者：PHP大傻子 | 来源：互联网 | 2023-10-11 12:47

研究背景垃圾目标检测作为垃圾分类自动化的一个重要环节，本文将尝试实现该过程。所谓目标检测，简单来讲就是检测图像中的对象是什么以及在哪里的问题࿰

研究背景

垃圾目标检测作为垃圾分类自动化的一个重要环节&＃xff0c;本文将尝试实现该过程。所谓目标检测&＃xff0c;简单来讲就是检测图像中的对象是什么以及在哪里的问题&＃xff0c;即"目标分类&＃43;定位"问题。

YOLO系列模型作为one-stage类目标检测任务的代表算法&＃xff0c;凭借其快速、泛化性能好等特性深受研究者喜爱。在前不久&＃xff0c;YOLOv5也在GitHub上正式发布&＃xff0c;其立即在网上引发了广泛热议。本文将参见官方提供的使用教程&＃xff0c;尝试简单利用YOLOv5网络模型在TACO数据集上实现垃圾目标检测任务。

数据集处理

TACO是一个数据正在不断增长的垃圾对象数据集&＃xff0c;其以树林、道路和海滩为拍摄背景&＃xff0c;目前包含60个类别的垃圾对象&＃xff0c;共1500张图像&＃xff0c;近5千份标注。该数据集项目参见&＃xff1a;https://github.com/pedropro/TACO

一方面&＃xff0c;考虑到该数据集文件存放格式和标签格式要符合YOLOv5模型的相关要求&＃xff1b;另一方面&＃xff0c;也考虑到该数据集中各垃圾类型对象的样本数量极其不均(如图1所示)&＃xff0c;因此&＃xff0c;本文首先需要对数据集进行必要的操作。对于数据集的处理代码可参见Mo项目[1]&＃xff0c;项目中的_readme.ipynb文件详细给出了相关代码使用的具体操作。

图1 TACO各类别对象的样本数量

对于TACO数据集的处理主要可分为以下两个过程&＃xff1a;

(1)由于TACO提供的标签为coco类型(所有信息存放在annotations.json文件中)&＃xff0c;项目首先需要将相关标签转换为yolo类型。与此同时&＃xff0c;考虑到本文仅对相关网络模型进行初探和个人硬件设备的欠缺&＃xff0c;该项目仅挑选出满足样本数量大于200的垃圾对象进行相关实验。上述操作的相关代码可以参考博客[1]提供的代码进行修改&＃xff0c;该代码可以作为模板用于满足自定义化coco格式转yolo格式需求。

经初步统计&＃xff0c;符合要求的垃圾类型(共8类)及其原编号如下所示&＃xff1a;

&＃39;Clear plastic bottle&＃39;: 5

&＃39;Plastic bottle cap&＃39;: 7

&＃39;Drink can&＃39;: 12

&＃39;Other plastic&＃39;: 29

&＃39;Plastic film&＃39;: 36

&＃39;Other plastic wrapper&＃39;: 39

&＃39;Unlabeled litter&＃39;: 58

&＃39;Cigarette&＃39;: 59

对于coco格式转yolo格式需求&＃xff0c;其主要需完成以下三项任务&＃xff1a;

·存储生成的标签和图像分别至两个文件目录中&＃xff0c;同时标签和图像的文件命名要求一致

·将目标对象原标签集合递增顺序映射至{0-7}空间

·由于原始标签中位置信息为{top_x, top_y, width, height}&＃xff0c;项目需要将其转换为{center_x, center_y, width, height}格式&＃xff0c;并将其数值进行归一化操作

其核心代码部分如下所示(cocotoyolo.py)&＃xff1a;

# 将垃圾类型原编号映射至{0-7}空间

label_transfer &＃61; {5: 0, 7: 1, 12: 2, 29: 3,

36: 4, 39: 5, 58: 6, 59: 7}

class_num &＃61; {} # 记录各类型样本数量

img_ids &＃61; data_source.getImgIds()

# 遍历每张图片&＃xff0c;对标签进行转换

for index, img_id in tqdm.tqdm(enumerate(img_ids), desc&＃61;&＃39;change .json file to .txt file&＃39;):

img_info &＃61; data_source.loadImgs(img_id)[0]

# 将含文件夹的路径修改为文件名

save_name &＃61; img_info[&＃39;file_name&＃39;].replace(&＃39;/&＃39;, &＃39;_&＃39;)

# 移去文件扩展名

file_name &＃61; save_name.split(&＃39;.&＃39;)[0]

# 获取单张图像的宽和高

height &＃61; img_info[&＃39;height&＃39;]

width &＃61; img_info[&＃39;width&＃39;]

# 转换所得txt文件存储路径

save_path &＃61; save_base_path &＃43; file_name &＃43;&＃39;.txt&＃39;

is_exist &＃61;False # 记录图片是否包含目标垃圾类型对象

withopen(save_path, mode&＃61;&＃39;w&＃39;) as fp:

# 根据图片编号找出垃圾对象的编号集合

annotation_id &＃61; data_source.getAnnIds(img_id)

boxes &＃61; np.zeros((0, 5))

iflen(annotation_id) &＃61;&＃61;0: # 集合大小为0

fp.write(&＃39;&＃39;)

continue

# 获取coco格式的标签

annotations &＃61; data_source.loadAnns(annotation_id)

lines &＃61;&＃39;&＃39; # 记录转换后yolo格式的标签

# 遍历对象标签集

for annotation in annotations:

# 获取垃圾对象的标签

label &＃61; coco_labels_inverse[annotation[&＃39;category_id&＃39;]]

if label in label_transfer.keys():

# 垃圾类型属于目标垃圾类型则进行格式转换

is_exist &＃61;True

box &＃61; annotation[&＃39;bbox&＃39;]

if box[2] <1or box[3] <1:

# 如果原标签中出现无长或宽数据的情况则跳过

continue

# top_x,top_y,width,height&＃61;&＃61;>cen_x,cen_y,width,height

box[0] &＃61;round((box[0] &＃43; box[2] /2) / width, 6)

box[1] &＃61;round((box[1] &＃43; box[3] /2) / height, 6)

box[2] &＃61;round(box[2] / width, 6)

box[3] &＃61;round(box[3] / height, 6)

label &＃61; label_transfer[label] # 标签映射

if label notin class_num.keys():

class_num[label] &＃61;0

class_num[label] &＃43;&＃61;1

lines &＃61; lines &＃43;str(label) # 先存储标签

for i in box: # 再存储位置信息

lines &＃43;&＃61;&＃39; &＃39;&＃43;str(i)

lines &＃43;&＃61;&＃39;\n&＃39; # 换行

fp.writelines(lines)

if is_exist:

# 存在目标类型对象&＃xff0c;则拷贝图像至指定目录

shutil.copy(&＃39;data/{}&＃39;.format(img_info[&＃39;file_name&＃39;]), os.path.join(save_image_path, save_name))

else:

# 不存在则删除所生成的标签文件

os.remove(save_path)

(2)完成标签集的生成后&＃xff0c;项目需要对其进行样本划分。首先&＃xff0c;项目需要将样本集按训练集使用全部样本&＃xff0c;测试集样本占总样本0.1比例的要求(其样本图片的数量分别为1086和109&＃xff0c;训练集使用全部样本是考虑到个人硬件设备较差的原因)进行划分。其次&＃xff0c;考虑网络模型对样本存储目录的要求&＃xff0c;项目需要将相应生成的图像和标签存储至相应的文件夹下&＃xff0c;其文件目录格式如图2所示。其实现代码参见Mo项目中的sample.py文件。

图2 数据集存储文件目录

模型配置与训练

YOLOv5项目的下载地址&＃xff1a;https://github.com/ultralytics

Mo平台上部署的项目参见同名项目[2]&＃xff0c;以下的所有内容可以参考官方教程[2]。该Mo项目的具体操作流程请参见根目录下的_readme.ipynb文件

模型配置

该部分主要涉及相关依赖安装和配置文件设置这两方面内容&＃xff0c;接下来&＃xff0c;本文将对上述内容进行简要说明。

(1)依赖安装

YOLOv5是由PyTorch深度学习框架搭建而成&＃xff0c;因此&＃xff0c;我们首先需要在Python中安装PyTorch框架&＃xff0c;安装教程可以参见官网的相关内容。此处给出PyTorch最新CPU版本的安装命令。

pip install torch&＃61;&＃61;1.5.1&＃43;cpu torchvision&＃61;&＃61;0.6.1&＃43;cpu -f https://download.pytorch.org/whl/torch_stable.html

除此之外&＃xff0c;YOLOv5模型运行还需要安装额外的第三方依赖包。官方已经将其全部放置在requirements.txt文件中。为了安装依赖尽可能不出错&＃xff0c;个人对该文件提出以下两点修改意见&＃xff1a;

1.本人fork该官方项目时&＃xff0c;numpy的版本要求是1.17&＃xff0c;但实际安装时会出现一些问题。因此&＃xff0c;个人建议将其版本要求修改为1.17.3。

2.该依赖文件所给出的cocoapi.git下载的地址&＃xff0c;在实际运行时下载的速度是非常缓慢的&＃xff0c;而且在Windows系统下还可能出现异常。因此建议将相应语句用下列语句进行代替&＃xff1a;

git&＃43;https://github.com/philferriere/cocoapi.git#subdirectory&＃61;PythonAPI

(2)配置文件设置

YOLOv5项目主要需要配置如下两个配置文件&＃xff1a;

1.data路径下的taco.yaml配置文件(自己创建)。该文件主要配置训练集和测试集存储图片的路径以及对象类型信息。对于标签存储路径的配置&＃xff0c;项目会自动根据图片存储路径来确定&＃xff0c;这也是为什么我们的数据集文件目录需要符合图2所示要求的原因。该配置文件的内容如下所示。

# train and val datasets (image directory or *.txt file with image paths)

train: taco/images/train/

val: taco/images/test/

# number of classes

nc: 8

# class names

names: [&＃39;Clear plastic bottle&＃39;, &＃39;Plastic bottle cap&＃39;,

&＃39;Drink can&＃39;,

&＃39;Other plastic&＃39;,

&＃39;Plastic film&＃39;, &＃39;Other plastic wrapper&＃39;,

&＃39;Unlabeled litter&＃39;, &＃39;Cigarette&＃39;]

2.models路径下与模型配置相关的配置文件编写。根据官方教程[2]&＃xff0c;研究者可以直接修改models目录下已存在的 yolov5_.yaml系列文件来进行相关配置。这里&＃xff0c;本人修改的是yolov5s.yaml文件(因为该实验使用yolov5s.pt作为模型预训练权重)。个人只要将该文件中nc属性的值修改为与上述taco.yaml的nc属性值一致即可。

模型训练

一方面&＃xff0c;由于个人电脑内存相对较小&＃xff0c;直接使用官方提供的训练参数设置将会导致内存爆炸而无法工作。因此&＃xff0c;该实验不得不通过减少输入图像规模和batch_size值来促使模型进行训练。另一方面&＃xff0c;由于个人电脑GPU性能较差&＃xff0c;该实验选择直接使用CPU来训练相关模型&＃xff0c;因此模型训练速度相对较慢。考虑到上述两方面的限制&＃xff0c;本实验模型训练时所涉及的相关参数配置如表1所示&＃xff1a;

表1 模型训练相关的参数配置

命令行参数	参数含义	设置值
--img	统一输入图像规模	320
--batch	每次网络训练输入图像的数量	4
--epochs	整个数据集参与训练的次数	100
--data	数据集配置文件路径	./data/taco.yaml
--cfg	模型配置文件路径	./models/yolov5s.yaml
--device	训练的设备(CPU or GPU)	cpu
--weights	预训练模型的权重文件	yolov5s.pt

模型训练的调用命令如下所示&＃xff1a;

python train.py --img320--batch4--epochs100--data ./data/taco.yaml --cfg ./models/yolov5s.yaml --device cpu --weights yolov5s.pt

关于预训练权重的下载&＃xff0c;这里就不进行详细介绍&＃xff0c;百度一下应该可以找到许多国内下载的资源。在这里&＃xff0c;本人在项目根目录下放置了yolov5s的权重文件(yolov5s.pt)以方便研究者训练模型。当然&＃xff0c;我们完全可以不使用预训练权重来直接进行模型训练&＃xff0c;只要移去上述命令的--weights yolov5s.pt部分即可。

效果展示

根据官方提供的教程&＃xff0c;模型训练所生成的各类结果将被自动放置在根目录的runs文件夹下。其中&＃xff0c;weights文件夹下将会存放模型训练所生成的效果最好和时间最近的权重文件&＃xff0c;我们可以用这些文件完成模型的调用任务&＃xff1b;results.txt文件存放着模型训练过程中的各项指标输出&＃xff0c;YOLO项目还自动对该输出结果进行了可视化操作&＃xff0c;生成了对应的图表图像。本实验各项指标的输出可视化图像如图3所示&＃xff0c;上方五张为训练集对应结果&＃xff0c;下方五张为测试集对应结果。

图3 模型训练过程各项输出指标的可视化图像

利用detect.py文件我们可以利用生成的模型来检测目标图像中是否存在需要检测的对象。为了方便起见&＃xff0c;我们将生成的模型权重best.pt放置在项目根目录下&＃xff0c;将需要检测的图像inference/images文件夹下。参考官方文档&＃xff0c;我们只需运行如下

代码即可展示模型目标检测的效果&＃xff1a;

python detect.py --weights best.pt --img320--conf0.4

目标图像检测的效果如图4所示&＃xff0c;检测生成的图像位于inference/output文件夹中。其中&＃xff0c;batch_1_000048图像中错误检测出了Drink can对象(此处主要与 conf设置值的大小有关&＃xff0c;个人可以对其进行适当的调整)。

图4 batch_1_000029(左)和batch_1_000048(右)的检测效果

实验小结

本文主要依托垃圾对象目标检测任务&＃xff0c;利用新颖的YOLOv5模型对TACO垃圾对象数据集进行了实验。由于个人硬件设备的不足和时间的限制&＃xff0c;参考官方给出的一些输出指标效果图和自行实验所得的图像检测结果&＃xff0c;可以看到本文最终所得到的模型的性能其实相对来说不算好(YOLO系列模型本身就是需要跑非常久的时间)。感兴趣地朋友可以尝试增大统一的图像规模、增大batch_size和epoch等方式来提高该模型的目标检测性能。

参考文献

项目地址

[1]TACO&＃xff1a;https://momodel.cn/workspace/5f0e734c95faedbb53ab3b26?type&＃61;app

[2]yolov5&＃xff1a;https://momodel.cn/workspace/5f0e7c929fda75fe7f4b01e9?type&＃61;app

主要文献

[1]将COCO中的.json文件转成.txt文件&＃xff1a;https://www.jianshu.com/p/8ddd8f3fdf73

[2]Train Custom Data&＃xff1a;https://github.com/ultralytics/yolov5/wiki/Train-Custom-Data

推荐阅读

get
logistic回归（线性和非线性）的开发笔记

本文由编程笔记#小编为大家整理，主要介绍了logistic回归（线性和非线性）相关的知识，包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 21:40:43
python
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
python
VScode格式化文档换行或不换行的设置方法

本文介绍了在VScode中设置格式化文档换行或不换行的方法，包括使用插件和修改settings.json文件的内容。详细步骤为：找到settings.json文件，将其中的代码替换为指定的代码。 ... [详细]

蜡笔小新 2023-12-14 17:15:38
version
baresip android编译、运行教程1语音通话

本文介绍了如何在安卓平台上编译和运行baresip android，包括下载相关的sdk和ndk，修改ndk路径和输出目录，以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]

蜡笔小新 2023-12-14 10:53:48
version
使用在线工具jsonschema2pojo根据json生成java对象

本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具，用户只需将json字符串复制到输入框中，即可自动将其转换成java对象。该工具还能解析列表式的json数据，并将嵌套在内层的对象也解析出来。本文以请求github的api为例，展示了使用该工具的步骤和效果。 ... [详细]

蜡笔小新 2023-12-13 21:23:45
grid
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
process
clone的fork与pthread_create创建线程有何不同

本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境，其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时，子进程只是完全复制父进程的资源，这样得到的子进程独立于父进程，具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制，另外通过fork创建子进程系统开销很大。因此，在某些情况下，使用clone或pthread_create创建线程可能更加高效。 ... [详细]

蜡笔小新 2023-12-12 20:00:06
process
【机器学习手册】日期和时区操作的重要性及应用

本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景，描述了学童们面对老先生的教导时的反应，以及上官如在这个过程中的表现。同时，文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后，文章强调了日期和时区操作在机器学习中的重要性，并指出了其在实际应用中的作用和意义。 ... [详细]

蜡笔小新 2023-12-12 17:40:14
hash
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
search
Metasploit攻击渗透实践

本文介绍了Metasploit攻击渗透实践的内容和要求，包括主动攻击、针对浏览器和客户端的攻击，以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码，以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]

蜡笔小新 2023-12-14 12:14:09
search
MySQL表分区的创建、增加和删除方法详解

本文详细介绍了MySQL表分区的创建、增加和删除方法，包括查看分区数据量和全库数据量的方法。欢迎大家阅读并给予点评。 ... [详细]

蜡笔小新 2023-12-13 12:26:11
go
Go GUIlxn/walk 学习3.菜单栏和工具栏的具体实现

本文介绍了使用Go语言的GUI库lxn/walk实现菜单栏和工具栏的具体方法，包括消息窗口的产生、文件放置动作响应和提示框的应用。部分代码来自上一篇博客和lxn/walk官方示例。文章提供了学习GUI开发的实际案例和代码示例。 ... [详细]

蜡笔小新 2023-12-12 20:56:55
go
手机移动端HTML5和JavaScript如何实现视频上传和压缩视频质量？

本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量，或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频，只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量，只有使用JAVA编写Android客户端才能实现压缩。此外，作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因，并提供了解决方法。最后，作者还介绍了一个用于处理图片的类，可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]

蜡笔小新 2023-12-12 15:58:44
python
CentOS安装Python2.7.2的步骤和注意事项

本文介绍了在CentOS上安装Python2.7.2的详细步骤，包括下载、解压、编译和安装等操作。同时提供了一些注意事项，以及测试安装是否成功的方法。 ... [详细]

蜡笔小新 2023-12-12 13:54:31
go
Android日历提醒软件开源项目分享及使用教程

本文介绍了一款名为Android日历提醒软件的开源项目，作者分享了该项目的代码和使用教程，并提供了GitHub项目地址。文章详细介绍了该软件的主界面风格、日程信息的分类查看功能，以及添加日程提醒和查看详情的界面。同时，作者还提醒了读者在使用过程中可能遇到的Android6.0权限问题，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-10 19:01:03

PHP大傻子

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章