摘 要
安全帽作为施工人员防护头部的工具,对工人的人身安全有着极 其重要的作用。现存的安全帽佩戴状态检测主要是基于人工监控,人 工监控要求监测人员时刻保持在岗状态,但是人工监控容易出现疏 漏,存在漏检情况。基于计算机视觉的安全帽佩戴状态检测可以代替 人工监控工作。在不同施工场景下检测安全帽的佩戴情况已成为人工 智能、模式识别等领域的研究热点,尤其是在计算机视觉领域。针对 安全帽佩戴状态检测的复杂性,本文从图像特征描述、特征提取、目 标检测等环节提出了两种检测研究方法。本文具体研究工作和创新点 包括以下两点:
一、提出一种改进增强随机蕨算法(Improved Boosted Random Ferns Algorithm, IBRFs),并应用在安全帽佩戴状态检测中。针对安 全帽佩戴状态检测在复杂的建筑场景下容易失效的问题,本文以随机 蕨算法作为基础,首先,利用方向梯度直方图(Histogram of Oriented Gradient, HOG)对图像进行特征提取,形成图像的特征域空间;其次, 在特征域空间采用随机二元测试的方法构建随机蕨;再次,在随机蕨 上选择目标与背景之间存在显著差异的位置点和参数,构建具有一定 识别能力的弱分类器;最后,采用 Real AdaBoost 算法,构建强分类 器对图像进行分类预测。由于 Real AdaBoost 算法中分类器的构建只 是将多个弱分类器进行简单的加权组合,没有很好的发挥弱分类器的 作用,因此本文提出了一种改进增强随机蕨算法,利用加权系数法选 择多个判别性较强的弱分类器构建强分类器。在实时的安全帽检测任务中,本文提出的 IBRFs 算法检测精确度达到 92.74%,相对于 BRFs 算法准确率提高了 9.5%左右,极大地提高了分类准确率。在普通环 境下,可以实现 8 f / s的检测速度,满足实时检测的要求。
二、构建ResNet50-SSD(ResNet50-Single Shot Multi-box Detector) 模型,并应用在安全帽佩戴状态检测中。为了解决实时场景下小尺寸 目标检测准确性较低的问题,本文提出了一种基于 ResNet50-SSD 的 安全帽佩戴状态检测模型。该模型以 SSD(Single Shot Multi-box Detector)网络作为基础,首先,将基础网络VGG-16替换为ResNet-50, 并对 ResNet-50 中 conv4_x 的第一个残差网络结构进行修改,使得第 一个输出的特征矩阵大小不变;其次,在 conv4_x 之后添加一系列的 附加层,并引入批量归一化(Batch Normalization, BN)层,加快网 络收敛速度;再次,分别在不同的特征层上对不同尺寸的目标进行预 测;最后,通过非极大值抑制算法,滤除掉小概率的目标得到最终的 检测结果。在国际公开的安全帽数据集 SHWD 上,本文提出的 ResNet50-SSD 模型检测精确度为 80.4%,相对于 VGG16-SSD 模型提高 了 2.23%左右,检测速度为每秒 35 帧,满足实时检测的要求。 本文将提出的两种算法分别在实时场景下的数据集和国际公开 的数据集上对安全帽佩戴状态进行实验检测,并与现存的其它先进目 标检测算法进行比较并分析,验证了本文算法在检测精确度和实时性 上的优越性。通过实验验证,本文提出的算法在确保较高检测精确度 的同时亦能满足实时检测的要求,具有较强的泛化能力和鲁棒性,能 够适应复杂环境下的安全帽佩戴状态实时检测。
关键词:目标检测安全,帽佩戴状态检测,增强随机蕨加权系数,ResNet50-SSD
Abstract:
Safety helmet, as a tool to protect the head of constructor, plays an extremely important role in the personal safety protection of workers. The existing helmet wearing status detection is mainly based on manual monitoring. Manual monitoring requires monitoring personnel to keep on duty at all times, however, manual monitoring is prone to oversight, there is a situation of missing inspection. Safety helmet wearing status detection based on computer vision can replace manual monitoring. Detecting the wearing of safety helmet in different construction scenarios has become a research hot spot in artificial intelligence, pattern recognition and other fields, especially in computer vision field. Aiming at the complexity of detecting the safety helmet wearing status, this paper proposes two detection methods in the process of image feature description, feature extraction, and object detection. The specific research work and innovations of this paper include the following two point
1. Propose an Improved Boosted Random Ferns Algorithm (IBRFs) and apply it to the detection of safety helmet wearing status. Aiming at the problem that helmet wearing status detection is easy to fail in complex architectural scenes, this paper takes random ferns algorithm as the basis. Firstly, the image features are extracted by Histogram of Oriented Gradient (HOG) to form the feature domain space of the image. Secondly, random ferns were constructed by random binary test in feature domain space. Then, the position points and parameters with significant difference between object and background were selected on random ferns to construct weak classifiers with certain recognition ability. Finally, the Real AdaBoost algorithm is used to construct a strong classifier for image classification and prediction. Since the construction of classifier in Real AdaBoost algorithm is only a simple weighted combination of multiple weak classifiers and does not play the role of weak classifiers well, an improved enhanced random ferns algorithm is proposed in this paper. The weighted coefficient method is used to select multiple weak classifiers with strong discriminant characteristics to build a strong classifier. In the real-time helmet detection task, the detection accuracy of the IBRFS model proposed in this paper reaches 92.74%, which is about 9.5% higher than that of the BRFS model, and greatly improves the classification accuracy of the classifier. In a normal environment, the detection speed of 8 f / s can be achieved to meet the requirements of real-time detection.
2. The ResNet50-SSD (ResNet50-Single Shot Multi-box Detector) network is constructed and applied in the safety helmet wearing status detection. In order to solve the problem of low accuracy of small-scale object detection in real-time scenes, this paper proposes a method of helmet wearing status detection based on ResNet50-SSD network. The model is based on the SSD (Single Shot Multi-box Detector) network. Firstly, the basic network VGG-16 is replaced with ResNet-50, and the structure of the first residual network of conv4_x in ResNet-50 is modified to make the size of the eigenmatrix of the first output constant; Secondly, a series of additional layers are added after conv4_x and the Batch Normalization (BN) layer is introduced to speed up the convergence of the network. Thirdly, the objects of different sizes are predicted in different feature layers. Finally, the non-maximum suppression algorithm is used to filter out the objects with low probability to get the final detection result. On the international pubilc safety helmet dataset SHWD, the detection accuracy of the ResNet50-SSD model proposed in this paper reaches 80.4%, Compared with vgg16-ssd model, it improves by 2.23%, and the detection speed is 35 frames per second, which meets the requirements of real-time detection.
The two algorithms proposed in this paper are used to test the wearing status of safety helmets in real-time scenes datasets and international public datasets respectively, and compared with other existing advanced object detection algorithms, it verifies the superiority of the proposed algorithm in detection accuracy and real-time performance. Through experimental verification, the proposed algorithm can not only ensure high detection accuracy, but also meet the requirements of real-time detection. It has strong generalization ability and robustness, and can adapt to real-time detection of safety helmet wearing status in complex environment.
Keywords: Object detection Safety helmet wearing status detection Boosted Random Ferns Weighting coefficient ResNet50-SSD
目 录
1 绪 论
在本章中,首先,对本文的研究背景及意义进行简要阐述;其次,对国内外安全 帽佩戴状态检测研究的最新研究现状进行阐述,分析现存的主要问题;最后,介绍本 文的主要研究内容,并对本文的组织结构进行简要概括。
1.1 研究背景及意义
1.1.1 研究背景
近年来,随着城镇化建设、新农村建设的加速发展,国家大力发展基础设施建设, 各类施工作业遍布大小城市。生产安全也成为了国家及各级政府最为关注和重视的问 题,然而许多施工场地仍存在着严重的安全隐患,根据住房和城乡建设部统计,2019 年全国共发生房屋市政工程生产安全事故773起、死亡904人,给社会和家庭带来了巨 大的损失,建筑施工行业的安全形势十分严峻[1].因此,最大限度地降低安全隐患, 提高施工人员自身的安全意识迫在眉睫。虽然通过安全教育培训,可以增强作业工人 的安全意识,一定程度上减少安全事故发生的概率,但是,要从根本上解决问题,避 免因为未佩戴安全帽而造成的安全事故,还是需要科学、合理、高效的监控和管理[2]. 随着科技的发展,大多数的施工作业场地都安装了监控设备,负责监控管理的人 员会定时进行视频监控处理,实现安全帽佩戴状态的实时监测,但是目前的安全帽检 测系统依旧存在着以下问题:
(1)检测精确度低:目前的安全帽检测算法分为传统的目标检测算法和深度学 习检测算法。但是由于施工场景复杂、检测目标之间存在部分遮挡、现场天气变化、 光照等影响,导致安全帽佩戴状况的检测精确度较低。
(2)检测成本较高:对整个施工现场部署摄像头,规模较大且经济成本较高。 而且,施工场地工作繁忙且复杂,若专门安排人员进行监控,极大地消耗了人力、物 力、财力。而且检测工人不在工作岗位时,容易出现漏检的情况,一旦出现疏漏,将 会造成不可估量的后果。
1.1.2 研究意义
安全帽作为施工人员最基本的安全防护用品,主要作用是保护施工现场人员的头 部安全,防止被尖锐物体打击、碰撞,对施工人员的个人人身安全及财产安全有着很重要的意义[3-4].在施工现场,由于施工人员不重视、缺乏安全意识、掌握安全知识 欠缺等造成的一系列违规违纪操作,安全事故发生的现象时有发生。由于施工作业场 地环境较为复杂、范围较广、施工作业人员数量较多、负责监督管理的人员有限等原 因,要对施工现场工人安全帽佩戴状态进行全方位、全过程的检测是很难实现的。 为了保证施工作业人员的人身财产安全,有必要采用人工智能的技术方法,减少 施工现场因为没有佩戴安全帽而导致的安全事故发生。本课题基于计算机视觉,从理 论上,对主流的目标检测算法进行详细阐述,并做了相关的改进,结合图像处理技术 提出了安全帽佩戴状态的检测方法。实现了复杂作业场景下施工作业人员是否佩戴安 全帽的精确检测,降低了施工人员由于未佩戴安全帽而引发的安全事故发生率,对施 工现场的安全规范管理具有一定的指导意义和实际应用价值。
1.2 国内外研究现状
安全帽佩戴状态检测实际为二分类对象检测问题,为了提高安全帽佩戴状况检测 的精确度和实时性,国内外学者开展了很多具有创新性的研究工作。在模式识别领域 中,安全帽佩戴状态检测方法主要分为传统的目标检测算法和基于深度学习的检测算 法,为施工现场安全帽佩戴状态检测研究提供了较有价值的借鉴。
1.2.1 基于传统模式识别的安全帽佩戴状态检测
基于传统目标检测算法的安全帽佩戴状态检测,首先,采用滑动窗口对图像上每 个像素点进行遍历;其次,对检测目标的某种特性进行统计描述;最后,通过分类的 方法或者对提取到的特征进行建模,判定检测目标是否佩戴安全帽。
Rubaiyat 等人提出了一种基于特征提取的安全帽佩戴检测算法[5].首先,结合方 向梯度直方图 HOG 和图像的频域信息,对施工人员进行检测;其次,结合颜色和圆 环霍夫变换(Circle Hough Transform,CHT)特征,对安全帽进行检测。该方法在安 全帽佩戴检测任务中,能够实现安全帽的检测,但是检测精确度较低且只能检测特定 颜色的安全帽,泛化能力较差。李潇等人提出了一种基于支持向量机(Support Vector Machine,SVM)分类器与特征提取的安全帽检测模型[6].首先,采用帧间差分法对 视频图像进行分割;其次,提取图像的 HOG 特征,并通过 SVM 分类器判断图像中 是否存在行人;最后,对图像中的行人提取 Haar-like 特征,并采用 AdaBoost 分类器 判断行人是否佩戴安全帽。该方法提取图像的双重特征,很大程度上提高了检测精确 度,但是特征提取的过程较复杂、泛化能力差,不能满足实时检测。冯国臣等人提出了一种基于混合高斯模型的安全帽自动检测模型[7].首先,采用混合高斯模型在图像 预处理阶段进行前景检测;其次,对连通域进行处理分析,判断该连通域是否属于人 体,实现检测目标的自动跟踪;最后,在定位到的人头区域进行安全帽佩戴状态的自 动检测识别。该方法检测精确度高,受环境变化影响较小,但是在图像处理阶段耗时 较长,在实际应用中很难满足实时检测。刘晓慧等人提出了一种基于 SVM 分类器的 安全帽检测算法[8].
首先,对图像进行预处理,建立安全帽数据集;其次,采用肤色 检测的方法对人脸区域进行定位,获得安全帽所在位置的粗略定位,并手动剪裁安全 帽所在区域图像;接着,提取安全帽的 Hu 矩特征向量;最后,结合 Hu 矩特征向量 和 SVM 分类模型给出最终分类结果。该方法相对于神经网络缩短了时间、识别率也 有一定的提升、具有较好的泛化能力。但是,该方法应用场景单一,仅用于工地进出 口等固定场景,而且受视角影响较大。周艳青等人提出了一种基于局部二值模式 (Local Binary Pattern, LBP)特征的安全帽检测算法[9].首先,对视频图像进行预处 理,得到大小为22 ? 22的人头区域图像;其次,提取该部分的局部二进制统计特征; 最后,利用反向传播网络(Back Propagation, BP)神经网络对检测目标进行分类预测, 得到最终的检测结果。该方法简单易行,但是由于图像分辨率低、实际应用环境复杂, 所以检测精确度还有待提高。
王雨生等人提出了一种基于姿态估计的安全帽佩戴状态 检测算法[10].首先,在 OpenRose 模型上引入了残差网络对检测目标进行姿态估计; 其次,通过三点定位法确定头部的位置,缩小目标检测范围;最后,使用 RetinaNet 网络对头部区域进行检测判断安全帽的佩戴情况。该方法很好地解决安全帽与施工背 景之间类别不平衡的问题。由于检测的头部区域是确定的,训练时检测效果较好,但 是在实际应用中泛化能力较弱,对较小尺寸的目标检测效果不理想。Park 等人提出了 一种基于背景差分法的安全帽检测算法[11].
首先,利用背景差分法提取前景,基于图 像的 HOG 域提取目标边缘特征;其次,通过支持向量机实现人体和安全帽的检测; 最后,根据人体和安全帽的空间几何关系确定工作人员是否佩戴安全帽。但是,当检 测目标被部分遮挡,或者处于非站立、静止不动的时候,该方法存在一定的局限性。 综上所述,现存的基于传统模式识别的安全帽佩戴状态检测,在实际应用中存在 检测效果差、检测速度相对较慢、模型泛化能力差等问题。在实际应用中不能满足实 时监测的要求。
1.2.2 基于深度学习的安全帽佩戴状态检测
基于深度学习的目标检测算法是现存的主流方法,通过多次的卷积、池化处理, 将得到的特征矩阵输入分类器进行检测判定[12-17].
首先,通过卷积层实现目标的特征 提取;其次,将提取到的特征输入分类器中,得到最终的分类结果。 徐先峰等人提出了一种基于 MobileNet-SSD 的安全帽佩戴情况检测方法[18].首 先,该网络引入 MobileNet 网络替换单点多框检测(Single Shot Multi-box Detector, SSD)网络中的 backbone,构建更加轻量化的网络,提高模型的检测速度;其次,引 入迁移学习策略解决模型训练困难的问题。在安全帽检测任务中,MobileNet-SSD 相 比较于 SSD,在 CPU 平台下的检测速度得到了很大的提升,但是检测精确度有一定 的损失。陈柳等人提出一种基于视觉感受野的轻量化卷积神经网络对安全帽佩戴情况 进行检测研究[19].首先,该网络在 RFNet 网络的基础上添加了特征金字塔网络模块; 其次,在保证特征提取能力不变的情况下,采用 SE-Ghost 模块对主干网络进行轻量 化处理;最后,在复杂的施工环境下对不同形态不同尺度大小的安全帽进行识别检测。
与卷积神经网络相比,该方法在确保检测精确度的同时,采用了轻量化的模块,极大 地缩小了网络储存空间,提高了检测速度。庞殊杨等人提出了一种基于多任务级联卷 积神经网络(Multitask Cascaded Convolutional Neural Networks, MTCNN)网络的安全 帽识别方法[20].首先,对 MTCNN 网络进行简化;其次,采用普通卷积层构建全卷积 网络,提高模型检测精确度;再次,引入轻量化网络结构 MobileNet 对网络进行优化 处理,减小网络储存参数,加快运行速度;最后,调整网络参数对不同尺寸的安全帽 进行识别检测。林俊等人提出了一种基于 YOLO(You Only Look Once, YOLO)的安 全帽佩戴检测算法[21].
首先,将 YOLO 应用到未佩戴安全帽的单类检测问题中,对 YOLO 网络进行修改,将输出改为 18 维的张量;其次,根据损失函数和 IOU 曲线对 模型进行调整,得到最终的安全帽检测模型。但是,该算法在目标重叠、密集目标场 景下依然会出现漏检情况。方明等人提出了一种基于 YOLOv2 的快速安全帽检测算 法[22].首先,在 YOLOv2 中加入密集块,提高了对小目标检测的敏感度;其次,采 用轻量化网络结构对网络进行压缩,减小了参数量,增加了模型的可用性。改进后的 YOLOv2 模型在保证一定的检测准确率的同时,很大程度上提升了检测速度,但是, 当检测目标和背景颜色相差不大时,改进后的 YOLOv2 模型对颜色的适应性较低, 会存在漏检现象。徐守坤等人提出了一种基于语义规则和语义模块的 YOLOv3 检测算法对安全帽佩戴情况进行检测研究[23].首先,对采集的数据进行预处理,得到安全 帽佩戴检测数据集和图像字幕数据集;其次,使用 K-means 算法确定数据集的锚框参 数值,并使用 YOLOv3 网络进行训练检测;再次,定义语义规则并结合目标检测结 果,提取出视觉概念;最后,对图像字幕进行填充得到对应的语句模板,并生成安全 帽佩戴的图像描述语句。施辉等人提出了一种基于 YOLOv3 算法的安全帽佩戴情况 检测方法[24].首先,通过图像金字塔结构获得不同尺度的特征图;其次,对目标检测 框进行聚类处理,并确定目标检测框参数;最后,将改进的 YOLOv3 模型应用到实 际场景中,并在训练过程中不断调整输入图像的尺寸,增加模型的泛化能力。
结果显 示改进后的 YOLOv3 算法在检测准确率与检测速率上相较于 YOLOv3 均略有提高, 在保证较高精确度的同时满足了安全帽佩戴检测的实时性。徐守坤等人针对安全帽检 测任务中存在的部分遮挡、检测目标尺寸不一以及小目标检测困难等问题,提出了一 种改进的 Faster RCNN 和多部件结合的安全帽佩戴检测算法[25].首先,以 Faster RCNN 网络作为基础,使用多尺度训练、增加锚点数量对 Faster RCNN 网络模型进行优化, 增强网络对不同尺寸目标检测的鲁棒性;其次,引入在线困难样本挖掘策略,解决正 负样本不均衡问题。该方法解决了目标尺寸差异大、遮挡等问题,克服了训练时负样 本空间过大的缺点,进一步提高了检测的准确率。但是,因为人员的姿态不一,Faster RCNN 网络只能粗略的选取安全帽的相对位置。王兵等人提出了一种基于改进 YOLOv3 的算法对安全帽佩戴状态进行检测研究[26].
首先,针对 YOLOv3 目标检测 算法存在的目标函数与评价指标不统一的问题,将改进的 GIOU 算法与 YOLOv3 算 法目标函数相结合,进一步减少预测框中负样本对模型训练的影响;其次,将改进后 的 YOLOv3 算法应用到安全帽佩戴检测任务中。改模型实现了目标函数局部最优, 具有很好的鲁棒性和泛化能力。王成龙等人提出了基于面部特征与卷积神经网络相结 合的算法[27].首先,以多任务级联卷积神经网络(MTCNN)对检测目标进行脸部特 征提取,然后,将卷积神经网络与 VGG 深度卷积神经网络相结合实现安全帽检测。
该检测模型占用内存小、识别准确性高、算法实用性强。Cheng Rao 等人提出了一种 SAS-YOLOv3-tiny 算法对安全帽进行检测研究[28].首先,采用三尺度特征进行特征预 测;然后,在特征提取网络中加入了改进的空间金字塔池(SPP)模块,提取具有丰 富语义信息的局部和全局特征;最后,引入了完全交过联(CIoU)损失对损失函数进 行改进。该算法在减少参数和计算量的同时,获得更多的信息特征,提高检测性能,速度比重量级模型更快。 综上所述,基于深度学习的安全帽佩戴状态检测,在检测效果上要优于传统的机 器学习算法,但是,由于至今尚未有公开的大型安全帽数据集可供探究,而且基于深 度学习的目标检测方法需要很高的硬件支持,所以基于深度学习的安全帽佩戴检测研 究在小样本上的无偏差估计效果欠佳,实时性受到了一定的限制。
1.2.3 难点与挑战
安全帽佩戴状态检测,通过安装在监控现场的摄像头或相机获得图像,利用计算 机视觉对图像进行处理,将佩戴安全帽与不佩戴安全帽的人作为两类不同的目标进行 检测。虽然经过多年的研究发展与积淀,安全帽佩戴检测取得众多丰硕的成果,但是 在实际场景中的安全帽佩戴检测仍然存在以下几个问题亟待研究攻克:
(1)存在检测速度低,实时性差的问题。 对于施工现场的安全帽佩戴行为检测研究而言,除了要求检测精确度之外,是否 能进行实时检测也是一个巨大的挑战。由于训练模型的参数过多,导致运行内存占用 量过高。计算机很难在兼顾检测精确度的同时满足实时检测的要求。因此,如何在确 保检测精确度的同时进行实时监测也是待解决的问题之一。
(2)存在漏检、误检现象,精确度不高的问题。 在实际场景中,由于安全帽区域占佩戴安全帽工人区域比例相对较小,网络可能 会将未佩戴安全帽的人员误检为目标;在人多复杂的环境下,工人之间相互遮挡、工 人被物体遮挡,导致检测到的安全帽位置不是很明显,可能会存在漏检和误检现象。 因此,如何精确有效地对视频中的施工人员是否佩戴安全帽进行检测研究,也是现存 的安全帽佩戴状态检测的主要问题。
1.3 研究内容
本文利用传统目标检测技术和深度学习技术对安全帽佩戴状态进行检测研究,首 先,将随机蕨算法(Boosted Random Ferns Algorithm, BRFs)应用到安全帽佩戴状态 检测研究上。实验分析发现随机蕨算法在安全帽佩戴状态检测任务中,当检测环境较 为复杂时,存在精确度不高、对小尺寸目标检测不敏感等问题。针对复杂环境下精确 度不高这一问题,采用增强策略对随机蕨算法进行改进,改进后的算法在保证检测速 度的同时提高了检测的精确度。针对小尺寸目标检测不敏感的问题,提出了改进的SSD 算法实现了多尺度的检测,在一定程度上提高了小尺寸目标的检测精确度。本文 的主要研究内容及创新点主要包括:
(1)基于改进增强随机蕨算法的安全帽佩戴状态检测研究 本章提出了一种改进增强随机蕨算法(Improved Boosted Random Ferns Algorithm, BRFs),将随机蕨算法与改进的 Real AdaBoost 策略相结合,构建一个检测精度较高 的分类器,并将其应用到安全帽佩戴检测任务中。首先,基于图像 HOG 域,对图像 进行特征提取形成图像特征域;其次,在图像特征域上通过随机二值检测方法提取图 像边缘,并构建随机蕨;接着,在随机蕨上选择目标与背景之间存在显著差异的位置 点和参数,构建具有一定识别能力的弱分类器;最后,采用增强策略选择判别性较强 的弱分类器构建强分类器,实现安全帽佩戴状态的检测。基于改进增强随机蕨算法, 在安全帽佩戴状态检测研究中,能够从较少的训练样本上有效地学习目标特征,准确 地检测出目标物体,在复杂环境下展现了很好的鲁棒性和泛化能力。
(2)基于改进 SSD 算法的安全帽佩戴状态检测研究 本章提出了一种 ResNet50-SSD 算法,以 SSD 网络作为基础模型,对 SSD 网络 基础模型进行修改,并引进了批量归一化层,构建了对小目标检测精度较高的分类器, 并将其应用到安全帽检测任务中。首先,将基础网络 VGG-16 替换为残差网络 ResNet-50,解决 SSD-VGG16 在模型训练中出现的梯度消失及退化等问题;其次,在 ResNet-50 之后添加一系列的附加层,并在附加层中引入 BN 层,解决多尺度预测的 问题;最后,通过非极大值抑制算法,滤除掉小概率的目标得到最终的检测结果。实 验表明,基于 ResNet50-SSD 的安全帽佩戴情况检测算法,在一定程度上提高了小尺 寸目标的检测精确度。
1.4 论文组织结构
本文主要对基于计算机视觉的安全帽佩戴状态检测任务进行研究,主要研究内容 分为五个章节。
(1)绪论:首先,概述本文的研究背景与意义;其次,阐述国内外安全帽佩戴 状态检测研究的最新研究现状,并分析安全帽佩戴状态检测研究存在的问题;最后, 介绍本文的主要研究内容,并对本文的组织结构进行简要概括。
(2)相关理论基础:对随机蕨算法和 SSD 网络的相关理论进行简要叙述。
(3)基于增强随机蕨的安全帽佩戴状态检测研究:首先,通过方向梯度直方图 对图像进行特征提取,形成图像的特征域空间;其次,在特征域空间上采用随机二元 测试方法构建随机蕨,并通过随机蕨构建弱分类器;再次,结合加权系数法利用 Real AdaBoost 算法选择最具判别性的弱分类器构建强分类器;最后,在安全帽数据集中对 IBRFs 进行训练和测试。
(4)基于 ResNet50-SSD 算法的安全帽佩戴检测研究:首先,将 SSD 网络的基 础网络 VGG-16 替换为 ResNet-50,并在附加层中引入 BN 层;其次,分别在不同的 特征层上对不同尺寸的目标进行预测;最后,利用非极大值抑制算法求出检测结果, 并对其进行分析比较。
(5)总结与展望:对本文的主要研究内容并对结果进行总结,并对下一步研究 工作进行规划。 本文各个章节间的组织关系如图 1-1 所示。
2 相关理论基础
2.1 随机蕨算法
2.1.1 贝叶斯分类
2.1.2 朴素贝叶斯分类
2.1.3 半朴素贝叶斯分类
2.1.4 随机蕨分类器构建
2.2 卷积神经网络
2.2.1 卷积层
2.2.2 池化层
2.2.3 全连接层
2.3 SSD 网络结构
2.3.1 特征提取
2.3.2 Prior box 选取
2.3.3 预选框的处理
3 基于改进增强随机蕨的安全帽佩戴检测研究
3.1 增强随机蕨算法
3.1.1 基于 HOG 域的随机蕨分类器
3.1.2 增强随机蕨
3.2 改进增强随机蕨算法
3.2.1 AdaBoost 算法
3.2.2 Real AdaBoost 算法
3.2.3 改进的增强随机蕨算法
3.3 实验结果及分析
3.3.1 实验设置
3.3.2 不同集成算法对比分析
3.3.3 相同场景下改进前后的检测效果
3.3.4 安全帽佩戴状态检测模型分析
3.4 本章小结
4 基于 ResNet50-SSD 的安全帽佩戴状态检测研究
4.1 基础网络
4.1.1 ResNet-50
4.1.2 批量归一化
4.2 ResNet50-SSD 模型
4.2.1 网络结构
4.2.2 损失函数
4.3 实验结果及分析
4.3.1 实验环境配置
4.3.2 loss 曲线及迭代次数实验结果分析
4.3.3 小尺寸目标的检测性能分析
4.3.4 检测准确度分析
4.4 本章小结
5 总结与展望
本工作编程语言环境为 Matlab 和 Python,针对安全帽佩戴状态检测精确度 较低和实时性较差的问题,分别提出了 IBRFs 算法和 ResNet50-SSD 模型,并采 用国际公开的安全帽数据集和互联网爬虫数据集验证算法和模型的有效性。现将 本研究的工作进行总结与展望。
5.1 总结
本文主要对基于计算机视觉的安全帽佩戴情况检测算法展开研究,提出了 IBRFs 算法和 ResNet50-SSD 模型对施工工人佩戴安全帽的情况进行预测,实现 了快速准确的检测,为工地安全监督及执法提供了技术保障,对施工现场的安全 管理具有重要的意义。本文主要工作总结及创新如下:
(1)数据集构建。本文基于计算机视觉对安全帽佩戴状态进行检测研究, 但是当前并没有公开可用的大型安全帽检测数据集,这无疑很大程度上增加了研 究的难度。针对这个问题,本文通过网络爬虫技术,并采用了 LabelImg 对数据 进行标记处理,构建安全帽检测数据集。本文构建的安全帽检测数据集为后续的 实验提供了数据支撑。
(2)基于增强随机蕨的安全帽佩戴状态检测研究。提出了一种改进增强随 机蕨的算法(IBRFs),该方法将增强随机蕨算法(BRFs)和一种改进的增强策 略相结合,构建一个检测精度较高的分类器。首先,借鉴增强随机蕨算法(BRFs) 的思想,基于图像 HOG 域,对图像进行特征提取,形成图像特征域;然后,在 图像特征域上构建通过二值比较方法构建随机蕨,并选择随机蕨中判别性最强的 位置点和参数构建弱分类器;最后,采用增强策略,选择最具判别性的弱分类器, 构建最优的安全帽佩戴检测分类器。实验证明,在进行安全帽佩戴任务检测时, 本文提出的改进增强随机蕨的算法(IBRFs)具有较高的检测精度。
(3)基于深度学习的安全帽佩戴状态检测研究。提出了一种 ResNet50-SSD 模型,该模型以 SSD 网络作为基础,首先,使用 ResNet-50 网络进行特征提取, 并对 ResNet-50 中 conv4_s 的第一个残差网络结构进行修改,使得第一个输出的 特征矩阵大小不变,其次,在 conv4_s 后续添加的一系列附加层中引入了 BN 层,分别在不同的特征层上对不同尺寸的目标进行预测;最后,通过非极大值抑制算 法,滤除掉小概率的目标得到最终的检测结果。实验证明,该模型使用了残差网 络进行多尺度训练后,模型能够适应不同分辨率的安全帽佩戴状态检测任务。
5.2 展望
基础设施的建设加快了城镇化建设的脚步,施工场所的安全问题也成为了人 们担心的重点问题。本研究主要针对安全帽佩戴状态进行相关的检测研究,从传 统的机器学习方法和深度学习方法两方面,对安全帽佩戴状态检测模型进行改 进,但是研究中仍然存在一些不足,主要体现在以下两个方面:
(1)检测精确度低问题。针对安全帽佩戴状态检测精确度较低的问题,本 文并未考虑到当拍摄角度不同、光照变化、天气变化、物体遮挡等问题对检测精 度的影响,因此下一步研究的重点将考虑如何解决该问题。
(2)检测速度低问题。针对安全帽佩戴状态检测速度较低的问题。本文并 未考虑到如何从减小模型参数、缩小网络结构、对图像进行预处理等方面减小运 行内存。下一步将研究如何减小模型的运行内存,提高模型检测速度问题。 针对上述问题,对未来的工作展望如下:
(1)多特征融合。考虑从多个角度提取多重特征,将不同的特征进行融合, 提高检测模型对检测目标的灵敏度,将传统的特征提取方法与深度学习方法相互 融合,进一步提高模型检测精确度和检测速度。
(2)普适性。考虑如何将 IBRFs 算法和 ResNet50-SSD 模型运用到安全帽 佩戴检测的具体应用中,尝试分析本文的改进之处是否具有普适性,能否延伸到 通用的目标检测领域中。
致 谢
行文至此,落笔为终,民大七载青春,始于 14 年盛夏,至于 21 年盛夏。目 之所向,皆为过往。我曾有过困惑、迷茫、无助,但也曾被信任、被依赖、被认 可,七载青春承载了我再多的悲欢喜乐,留下的都是沉甸甸的青春和收获,纵使 万般不舍也要心怀感激。 桃李不言,下自成蹊。感谢我的导师张乾老师,您从未嫌弃我才学疏浅,从 论文的选题到定稿,每一个阶段都倾注了大量的心血和精力。学贵得师,亦贵得 友,于我而言是指路人、但更像是朋友,您的鼓励给我带来了莫大的勇气,在我 迷茫和不安的时候给了我一个坚定的方向,能成为"张总"的学生是让我最引以 为傲、最安心的事情。承蒙教诲,学生心怀感激,愿您桃李满天下,事事顺遂。 父母之爱子,则为之计深远。感谢爸爸妈妈赐我生命,节衣缩食,育我成长。
分享我的喜怒哀乐,聆听我的想法,给予我最大的支持与肯定。感谢姐姐和弟弟 们的陪伴,见证着彼此的成长,每次当我情绪崩溃的时候,你们是我最坚实的后 盾,让我心安、给我温暖,所有的委屈、不开心到你们这里就消失了。无以回报, 只想更加努力,成为你们的骄傲。
所遇皆良人,感谢我的师母金升菊,像姐姐一样分享着她的生活,教会我们 为人处世之道,虽然我们真正熟悉的时间不长,但是金老师总会给人一种安心踏 实的感觉。也要感谢我的小伙伴邵定琴,七年如一日照顾我,一起探讨解决问题, 相互帮助,分享着彼此生活的点点滴滴,见证彼此的成长。还要感谢实验室小伙 伴对我毕业论文的帮助,给我的生活带来了欢声笑语。
平生感知己,方寸岂悠悠。感谢我的小姊妹吴倩、肖琳、白宇、梁明秀,在 我低落的时候给我鼓励,包容我的小脾气,不遗余力地帮助和支持我,感谢你们 出现在我的生命中,并给我带来了温暖。愿有前程可奔赴,亦有岁月可回首。
以梦为马,不负韶华,感谢不曾言弃的自己,纵然过程坎坎坷坷,但依旧热 爱生活,每一次经历都是一种成长,都会在不经意间为我们的生活累积资本,愿 你做个说话做事让人舒服的女孩子。 愿吾师,事事顺遂!愿家人,身体健康!愿吾友,前程似锦!愿民大,孕育 英才!
(如您需要查看本篇毕业设计全文,请您联系客服索取)