基于深度学习的生活垃圾分类

2022-04-06版权声明我要投稿

  摘要:该文研究了将深度学习应用于垃圾分类,使用模型为微调后的ResNet50预训练模型,数据来源于华为开源垃圾数据集。通过对原始数据的标注、划分和增广得到该文所使用的数据集。增广方式包括几何变换、明亮度更改和添加噪声。经测试验证,本项目在测试集上的准确率能够达到87%,同时在实际场景中也有较好的泛化性。最后通过Flask、Gunicorn和微信小程序进行模型以及前端界面的部署。

  关键词:垃圾分类;迁移学习;数据增广;卷积神经网络;

  在2018年,中国已经成了为全球产生垃圾最多的国家,且在近几年生活垃圾产量保持5%左右的增长[1]。据国家统计局发布的《中国统计年鉴2020》指出,在2019年全国生活垃圾清运量就已达24206.2万吨[2]。与日俱增的垃圾不仅对宝贵空间资源造成了占用,而且污染生态环境。垃圾分类作为垃圾回收利用的起点,在垃圾回收利用的过程中起着至关重要的作用。按照相关规定将生活垃圾依照其对应类别进行分类可以有效地促进可回收垃圾再利用,减小了生活垃圾的处理量以及空间资源的占用,在生态和经济领域都有重要意义。

  虽然垃圾分类百利而无一害,但是居民参与度一直较低。解放日报曾对该现象进行过一次调查采访,多达51.8%的受访者表示分类标准对于他们来说比较复杂,在模拟垃圾分类实验中甚至有23.8%的受访者将可回收的玻璃瓶归类为有害垃圾。不难看出居民对垃圾分类标准的模糊制约着垃圾分类的实行。近年来深度学习在图像分类领域的快速发展使得通过深度学习进行垃圾分类成为可能。本项目的在于构建基于深度学习的识别分类准确率高的模型,帮助居民进行正确的垃圾分类,提高居民对垃圾分类的参与度。

2 ResNet模型

  随着神经网络深度的不断增加,模型精度并没有如人们所想的那样按照网络深度的增加而增加,反而训练误差和测试误差都升高了,显然这个问题并不是由于模型深度过深过于负责导致了过拟合,因为过拟合的现象表现为训练误差小,测试误差大,而深层神经网络的训练误差和测试误差都比浅层神经网络要大。这种加深神经网络的深度反而使神经网络模型性能下降的问题被称为退化问题,针对退化问题何凯明等人于2015年提出了ResNet[3],并在2015年ImageNet竞赛中获得第一名。何凯明等人指出退化问题可能是由于网络深度过深导致了梯度爆炸或者梯度消失阻碍了网络的收敛,同时深层次的神经网络中含有大量的ReLU等非线性激活函数,由于非线性激活函数是不可逆函数无法从输出推导出输入,这导致训练过程中信息的丢失使得函数无法表示自己本身,即难以表达恒等映射函数H(x)=x,为解决上述问题,ResNet引入了残差结构,如图1所示。

3 等比例缩放的应用

  在模型训练前,为满足神经网络的输入要求,需要按照要求将图片尺寸进行更改,但当仔细查看数据集时,可以发现数据集中某些分类之间存在着特殊的关系,比如食用油桶和饮料瓶,牙签和竹筷。因为它们的材质和形状的高度一致导致这些物体之间的最大的差异不是通常的形状和颜色差异,而是物体的长宽比例。但是如果进行缩放的图片的长宽比例与网络要求的长宽比例不相等,则会导致物体的长宽比例发生改变,最终影响模型的准确率。

  为解决上诉问题,本文采用等比例缩放方法对图片进行处理。对一张尺寸为(H,W)的图片,求出等比例缩放比例R,R表示如式1所示:

  其中Hobj和Wobj是目标尺寸,H和W是图片原始尺寸,min()函数为取两者中的较小值。将H,W按比例R进行缩放,缩放后尺寸小于目标值的一边用零值进行补齐,最后得到等比例缩放的图片。图2(a)是数据集中未经处理的原始图像,其尺寸为(200,268);图2(b)是未使用等比例缩放进行缩放至(224,224)的图片;图2(c)是使用等比例缩放进行缩放至(224,224)的图片。使用等比例缩放可以有效避免传统缩放方法在缩放图片的过程中对物体的长宽比例进行改变,在长宽比例特征较为重要的数据集中能够保持不同分类之间的差异性,有助于模型对物体更好地进行识别[4,5]。

4 基于ResNet的生活垃圾分类算法实现

  本项目采用ResNet50预训练模型作为backbone,对back⁃bone最后一层的全连接层进行修改,将含有1000输出神经元的全连接层替换为输出神经元为40的全连接层,对应40类垃圾。

5 实验结果及分析

  在Kaggle平台使用GPU对神经网络模型训练25批次,运行结果如下所示,在测试集上准确率能达到87%,图3为loss对比图,图4为准确率对比图。由于本项目所使用的数据集于2019年比赛结束后才正式公开,在此之前有关垃圾分类的文献使用的数据集规模多为4000张左右,缺乏对比性。使用该数据集的公开项目较为知名的有由thomas-yanxin开源的公开项目“慧眼识垃圾”,并于2021年4月17日获得了飞桨PaddlePad⁃dle公众号的周推荐第一名。本项目与其最大的区别在于模型选择以及缩放方法。在模型选择上,本项目采用的是ResNet50预训练模型,可以减少模型的训练时长。“慧眼识垃圾”采用的是ResNet50_vd,ResNet50_vd在ResNet50的基础上添加了知识蒸馏,虽然使模型能够达到更好的精度,但由于模型更大以及冷启动,所以推理时间更长且训练所需时间更多。在缩放方法上面,本项目采用的是等比例缩放,“慧眼识垃圾”采用的是常规缩放。

6 结束语

  本文验证了使用ResNet50进行生活垃圾分类的可行性,并通过数据增广等方式使模型在实际应用场景中有较好的泛化性。在实际应用场景的测试中,本项目的准确率也能够达到接近测试机准确率的水平,对于实际应用场景具有良好的泛化性。该项目的目的在于对进行垃圾分类感到困难的居民提供一个简洁、易上手的工具,帮助其正确地对垃圾进行分类,为垃圾分类政策的推广尽一份绵薄之力。

参考文献

  [1] 吕益敏.以史为鉴,开启垃圾分类新时代[J].城乡建设,2020(3):30-32.

  [2] 国家统计局工业统计司.中国工业统计年鉴-2020[M].北京:中国统计出版社,2020.

  [3] He K M,Zhang X Y,Ren S Q,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.June 27-30,2016,Las Vegas,NV,USA.IEEE,2016:770-778.

  [4] 董子源.基于深度学习的垃圾分类系统设计与实现[D].北京:中国科学院大学(中国科学院沈阳计算技术研究所),2020.

  [5] 陈莎莎,杜庆东.基于深度学习的可回收垃圾分类算法[J].现代工业经济和信息化,2021,11(1):22-23,40.

作者:贺朝辉 曾鹏程 单位:江西理工大学信息工程学院

【基于深度学习的生活垃圾分类】相关文章:

1.基于Tensorflow的垃圾分类回收系统设计

2.基于TensorFlow的新型智能垃圾分类系统研发

3.基于深度学习的小学语文单元整合教学策略

4.基于FPGA深度学习的行人重识别

5.基于深度学习的目标检测算法综述

6.基于深度学习的糖尿病性视网膜病变的分级

7.基于深度学习的腺体病理图像分割

8.基于深度学习的视觉关系检测方法

9.合理设置基于深度学习的小学数学课堂提问方法的技巧

10.高中化学课堂基于核心素养的深度学习

11.企业安全工作规范化管理建设论文

12.药用植物腊叶标本制作课程设计

文档上传者