基于深度学习的人员脱岗检测方法

王杭

云南电网有限责任公司昆明供电局云南昆明 650000

打开文本图片集

摘要：为了实时检测出办公区域企业员工在岗情况，本文提出了一种基于深度学习的人员脱岗检测方法，可以实现自动脱岗识别和报警。通过使用YOLOv3检测出是否有人员，并结合REID人员重识别方法将识别的人员进行比对和分类，最终识别出那些员工在岗，对于不在岗的员工给予报警并通过短信进行提醒。该方法能够有效结合人形，半身、全身，站姿、坐姿，正脸、背脸等来实现目标检测和识别，并且该方法对于环境适应性极强，能够满足复杂环境下的人员脱岗识别，为企业管理提供了技术支撑。

关键词：YOLOv3；REID；人员脱岗；目标检测；深度学习；

Abstract： In order to detect the on-duty situation of enterprise employees in the office area in real time， this paper proposes a personnel off-duty detection method based on deep learning， which can realize automatic off-duty identification and alarm. YOLOv3 is used to detect whether there are personnel， and REID's personnel re-identification method is used to compare and classify the identified personnel， so as to finally identify those employees who are on duty， and give SMS reminders or hints to those employees who are not on duty. This method can effectively combine human shape， half body， whole body， standing posture， sitting posture， front face， back face to achieve target detection and recognition， and this method is highly adaptable to the environment， can meet the personnel off duty recognition in complex environment， and provides technical support for enterprise management..

Key words：YOLOv3；REID；Personnel off duty; Object detection; Deep learning;

1引言

对于企业而言，办公区域人员在岗情况对于企业十分重要。为了加强企业管理，避免员工逃岗、脱岗，防止关键岗位人员不在岗而导致不可避免的损失，人员脱岗检测识别也就显得十分重要。针对人员脱岗情况检测，企业回结合视频监控技术来进行人工实时监查。但是，人工检查准确率和时效性难以保证，耗时耗力，效率极低。

为了提高人员脱岗检测的准确率，满足企业的实时检测要求，本文结合深度学习提出了一种基于YOLOv3的人员脱岗检测方法。该方法，对于人员在站立、坐立、睡觉等多种姿态下的识别效果显著，检测速度快。同时，可以实现多目标人员脱岗检测，并对脱岗的员工进行报警及其短信提醒，为企业的高效管理提供了技术支撑。

2相关研究

在办公区域人员是否脱岗检测中，会存在检测精度低、操作性差、易受外界干扰等问题，同时，在检测过程中需要考虑人员在站立与非站立时的多种姿势，一般的目标检测都是直立的人员检测，对于多种姿态下的人员检测检测效果不佳。

在人员目标检测中，钱宇骋等学者[1]提出了一种基于RetinaNet改进的轻量目标检测模型，在减少网络冗余的同时，增加了检测模型的精度，模型的推理速度得到了大幅度提升｡梁思源等学者[2]提出了一种基于深度学习的相似外部特征人员检测算法，采用 Fast Guided Filter来进行前期处理，然后输入到改进的YOLOv3中，最终使用 ELM进行分类｡程国安等学者[3]提出了一种基于深度学习框架 YOLOV4 的港口作业人员目标检测平台｡

为了有效提高目标检测模型对于不同人员姿态下的检测效果，彭雅坤等学者[4]采用 YOLOv5s 网络模型，改进损失函数，增加平衡因子，实现滑雪人员的快速检，该方法有效识别不同姿态下的滑雪人员｡室内人员姿态多变，且图像拍摄角度与室外行人差别较大，基于此，王璐璐等学者[5]提出了一种高精度检测模型，该模型以RetinaNet网络为基础，在残差网络中引入通道注意力模块，间接实现卷积层的随机失活，增强模型泛化能力｡

同时考虑到在办公区域欧人员检测中，会存在人员遮挡的情况。梁煜等学者[6]为解决目前实际监控场景下人员检测任务中存在的遮挡问题，提出了一种改进的 Yolov3 检测网络，设计了中心点预测模块（CPM）并将其嵌入到原Yolov3网络中3个尺度的输出特征图上，随后在此预提取的中心点上对目标的位置和尺寸进行精确的回归，并采用广义的交并比指标来构造损失函数进行优化。

在办公区域人员脱岗检测中，为了能够让模型学习人员在站立、坐立、弯腰等多种姿态下的特征，本文提出了一种基于YOLOv3的人员脱岗检测方法，将多种姿态下的人员特征输入到YOLOv3中实现目标检测，并结合PP-LCNET来进行目标跟踪与目标识别，识别出办公区域中人员的不同姿态，对于脱岗的员工给予提醒。同时，该方法对于人员遮挡下的检测效果也十分显著，检测速度快，满足了实时性要求。

3基于深度学习的人员脱岗检测方法

3.1 YOLOv3人员脱岗检测方法

在深度学习目标检测和识别任务中，速度一直是研究员和企业关注的重点。YOLOv3正是为了解决这一问题而诞生，它能在保持模型良好性能的基础上，很大程度地加快了监测和识别的速度，并且能够实时准确地进行高精度的数据运算。

YOLOv3模型结构如图1所示。YOLOv3使用Dark Net53结合残差网络作为基础网络结构，模型主要是由卷积核大小为3和1的卷积层组成，卷积计算过程中通过卷积层来实现特征图的变化。同时，YOLOv3在YOLO网络的基础上增加了多标签分类，并且融合了FPN进行多尺度预测来增强小目标检测的性能。

YOLOv3使用逻辑回归预测每个边界框的类别得分，并使用均方和误差作为损失函数。边界框是否含有目标通过置信度的值来确定，当置信度值越大时，边界框包含目标的可能性越大。如果某个先验边界框与真实对象重叠超过任何其他边界框，则该值置为1。如果边界框的优先级不是最高但是与真实对象重叠超过某个阈值，那么该值置为0。YOLOv3利用整张目标图像作为深度学习网络的输入，然后直接在输出层回归目标边界框的位置以及其所属的类别。

3.2 REID人员重识别

REID主要聚焦于行人重识别，有效解决了交叉摄像头图像匹配的问题，主要用于在交叉视角下对目标的跨视领检索。在行人重识别任务中，使用PP-LCNet作为行人重识别REID（Person Re-identification）模型。PP-LCNe作为轻量级的卷积神经网络模型，对于移动客户端效果比较显著。PP-LCNET在不增加网络延时的基础上，提高了模型性能。模型结构如图所示。

模型的改进之处：使用h-swish激活函数在不降低模型推理速度的基础上，提高了模型的性能；在网络的末尾部分使用SE结构使得模型在速度和性能方面达到平衡，并在SE模块使用了Relu和h-swish激活函数；为了进一步提升模型的推理速度，在模型的末尾部位使用5x5的单一卷积。由于GAP之后的特征维度较小，为了提高模型的表征能力，在GAP后接入了1280维度的高纬度的全连接层。

4基于深度学习的人员脱岗检测方法实现

为了有效识别出是否存在人员脱岗，基于此，本文提出了一种新的人员脱岗检测方法，可以实现自动脱岗识别和报警。该方法会识别人员离岗行为，防止一些关键性的岗位因疏忽造成不可估量的损失。室内、室外均可识别。在检测时，可调整检测时间，避免离岗一直报警或者长时间没有报警。可以通过识别人形，半身、全身，站姿、坐姿，正脸、背脸等来实现目标检测和识别。同时，对于同一相机视野内可以划定检测多个工位。检测到有离岗情况，系统可以自动发出语音报警，或发送消息到手机端提醒处理。

（１）图像采集和预处理

图像采集模块的功能比较简单，在服务器端实时采集摄像头视频流或分析一段已有的视频文件。是整个脱岗检测系统的一个宏观基础，为后续的运动目标检测与分析提供数据源。图像的预处理主要是对采集到的图像进行转换和优化，包含了图像灰度化、图像降噪、图像二值化以及形态学处理等部分，是图像识别与分析的前提。

（2）运动目标检测

运动目标检测模块主要从图像采集模块采集到的视频流中发现是否有运动中目标，并且通过Yolov3来进行目标检测。Yolov3算法是Yolo系列检测算法的第３个版本，主要由Darknet-53和YOLO层两部分组成，分别用于特征提取、尺度识别和分类。首先将输入图像调整到图像目标大小，使用类似特征金字塔（FPN）结构网络，在Darknet-53特征提取网络中将输入图像划分成S×S大小的单元格得到３种不同尺度的特征图，同时在每个单元格上的回归预测有３个anchorbox预测３个边界框。选取其中置信度最大的作为最终检测结果。Yolov3在每个单元格上预测了４个边界框坐标分别表示边界框左上角坐标和目标的宽和高。通过阈值设定，过滤掉得分较低的预测框，对剩下的进行非极大抑制（NMS）处理得到最终预测结果。

（３）运动目标识别

运动目标识别模块，可以说是系统中最重要的模块，也是算法比较繁琐密集的一个模块。该模块主要是对目标检测模块确定的运动目标区域展开分析，定位运动目标是谁，通过在工位上有人的基础上，在判断是哪个人，进一步精确人员脱岗。这部分，采用REID来学习人员特征。

身份重识别ReID（Re-identification），其定义是利用计算机视觉技术，在图像库和视屏序列中找到搜索目标的技术，ReID更像一个图像检索工具，把检测图像中的目标提取一个feature，然后根据feature判断前后图像的相似度，实现检索的目的。有学者将重识别看作是分类和验证２类问题：（1）分类是指将目标的ID或特征作为训练标签来训练模型。（2）验证是指判断输入的两张图像中是否有相同目标。在目标跟踪中，常常因为遮挡或者跟踪目标消失导致跟踪失败，利用行人重识别匹配失败跟踪，重新找到跟踪目标，是该项研究解决遮挡和目标跟踪错误的主要方法。首先对视屏第t-1帧图像进行目标检测，将检测到的目标进行特征提取，作为跟踪底库。对帧图像提取特征，并计算与底库中的图像特征的距离。根据所得结果排序，排名靠前则相似度高。利用rankI和map指标评价ReID算法，其主干结构为Resnet50，将输入图像经过卷积得到特征图谱，然后经池化层输出特征向量，最后识别最终结果。

（４）报警模块

报警模块，是当识别模块对运动目标的识别有了明确的判定，而后通过此模块进行终端交互，从而进一步得到确定的结论，此时可以明确判断视频画面中是否有人，如果有人识别出那个人。当画面无人时，可以根据用户系统的设置判断是否报警和报警方式。并且对报警信息进行存储。

5结论

为了有效解决办公区域人员脱岗，关键岗位人员脱岗等情况，基于此，本文提出了一种基于深度学习的办公区域人员脱岗报警方法。通过将采集到的数据进行预处理和增强后，输入到YOLOv3中进行运动目标检测，然后采用PP-LCNET来进行运动目标识别。该方法可以通过识别人形，半身、全身，站姿、坐姿，正脸、背脸等来实现目标检测和识别，对于检测到有离岗情况，系统可以自动发出语音报警，或发送消息到手机端提醒处理。该方法对于环境的兼容性强，能够满足复杂环境下的人员识别。

参考文献：

[1]钱宇骋，朱太云，曹旭航，黎瑞，龚恩，王健.基于Hi3559A的变电站人员闯入智能检测系统[J].电网技术，2021，45（10）：4181-4188.DOI：10.13335/j.1000-3673.pst.2020.1974.

[2]梁思源，王平，罗凡波，徐桂菲，王伟.基于改进YOLO v3的相似外部特征人员检测算法[J].平顶山学院学报，2020，35（02）：47-54.

[3]程国安，王浩，王胜科.基于YOLOV4的港口作业人员检测系统研究[J].软件导刊，2022，21（03）：95-99.

[4]彭雅坤，曹伊宁，刘晓群.基于YOLOv5s的滑雪人员检测研究[J].长江信息通信，2021，34（08）：24-26.

[5]王璐璐，张为，孙琦龙.一种改进RetinaNet的室内人员检测算法[J].西安电子科技大学学报，2019，46（05）：69-74+104.DOI：10.19665/j.issn1001-2400.2019.05.010.

[6]梁煜，李佳豪，张为，孙琦龙.嵌入中心点预测模块的Yolov3遮挡人员检测网络[J].天津大学学报（自然科学与工程技术版），2021，54（05）：517-525.

*本文暂不支持打印功能