• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于深度学习的高铁接触网吊弦缺陷图像识别技术研究

廖峪
  
富网媒体号
2024年199期
诺比侃人工智能科技(成都)股份有限公司 610045

摘要:接触网是电气化铁路的重要组成部分,吊弦在其中起着关键作用,连接承力索和接触线,确保电力传导和接触线弹性。然而,吊弦工作环境恶劣,常受自然环境和受电弓冲击的影响,易出现松弛、断裂等问题,威胁供电和铁路安全。尽管4C装置和图像处理技术提升了检测效率,但现有算法存在漏检和误检的问题,仍需人工复查。本文针对4C装置拍摄的吊弦图像,改进了Faster R-CNN算法用于吊弦定位,并通过引入ResNet101提升特征提取能力,同时使用K-means优化锚框尺寸,提高定位准确率。定位准确率达96.59%,召回率达97.19%。此外,使用改进的FCOS网络进行状态识别,采用VOVNet39优化特征提取,并调整GIOU和焦点损失函数,增强了对吊弦缺陷的识别能力。仿真结果表明,该方法能够准确定位吊弦并识别其缺陷,验证了算法的有效性和可行性。

关键词:接触网吊弦;目标定位;缺陷识别;图像处理;深度学习

1.引言

随着我国电气化铁路的快速发展,高速铁路凭借其大载客量、高舒适度、快捷和安全,已成为人们出行的首选交通方式。截至2022年底,全国铁路营业里程达15.5万公里,预计到2030年将形成以“八横八纵”为主的高速铁路网络。作为国民经济的重要基础,高铁的稳定运行对国家发展至关重要。接触网作为高铁供能系统的核心,吊弦负责连接承力索和接触线,改善接触线弹性并减少中间驰度。然而,吊弦因长期暴露在恶劣环境中,容易出现松弛、断裂等缺陷,威胁供电安全,因此其状态监测尤为重要。

我国依赖6C系统监测接触网部件状态,但由于吊弦数量庞大,现有人工复检效率低,容易出现误检和漏检。随着计算机图像处理技术的发展,深度学习的图像识别方法在多个领域展现了高效的特征提取和识别能力。国际上,德国和日本的接触网检测技术较为成熟,通过高分辨率图像检测实现实时监测,而我国近年来也在利用深度学习进行接触网缺陷识别方面取得了显著进展。

本文旨在基于深度学习技术,改进接触网吊弦的缺陷识别方法,通过优化Faster R-CNN和FCOS网络的特征提取和损失函数,解决现有系统中的误检和漏检问题,提高检测精度和效率,提升吊弦缺陷识别的准确性和鲁棒性。

2.深度学习与目标检测算法

2.1深度学习概述

深度学习的起源可以追溯到20世纪40年代,最初由控制论理论提出,通过模拟大脑神经网络的方式进行数据处理。之后,感知机模型被提出,通过硬件构建了类似神经网络的结构,能够实现数据的二分类,引发了对这一领域的关注。随着技术的进步,模型的激活方式也得到了改进,从最初的二值激活发展为线性激活,大大提升了系统的收敛性和计算能力。进入80年代后,反向传播算法的提出使得神经网络的计算能力得到了极大提升,并且随着网络深度的增加,网络的表现能力也相应增强。此后,长短期记忆网络(LSTM)的提出进一步推动了长序列数据建模的进展。

到了21世纪初,深度信念网络(DBN)的问世有效解决了训练过程中的梯度消失问题,使得深层网络的训练成为可能。随着科技的快速发展,计算机技术尤其是图像处理领域逐渐将深度学习引入其中,极大提升了图像处理的效率。卷积神经网络在图像识别中的应用进一步推动了技术的发展,通过模拟人类大脑神经元的连接方式,卷积神经网络能够从图像中逐层提取特征,实现了自动化、智能化的图像识别。如今,深度学习技术已经广泛应用于图像分类、检测、分割和生成等任务,并且在多个领域取得了显著的成效,如人脸识别、医学影像分析、智能交通管理和工业安全监控等。

2.2卷积神经网络(CNN)

卷积神经网络(Convolutional Neural Network,CNN)是一种结合卷积操作和深度结构的前馈神经网络,广泛应用于图像处理任务。它包括输入层、卷积层、激活函数、池化层和全连接层,能够自动学习图像中的特征,减少人工干预。在卷积层中,预设的卷积核通过遍历输入图像实现特征提取,卷积操作相当于加权求和,且通过对图像进行填充操作,可以提高对图像边缘信息的利用率。卷积神经网络通过激活函数引入非线性部分,常用的激活函数包括Sigmoid、Tanh和ReLU,其中ReLU因其简单高效,解决了梯度消失问题,应用最为广泛。池化层则通过下采样减少数据冗余,保留重要特征信息,增强网络的泛化能力和鲁棒性,常见的池化操作包括最大池化和平均池化。全连接层将卷积层和池化层提取到的特征进行整合,用于图像分类或其他任务的最终决策。通过这些层的组合,卷积神经网络展现了在图像处理中的强大能力。

2.2常见目标检测算法

深度学习中的目标检测算法可以根据锚框生成与定位方式分为一阶段目标检测网络和二阶段目标检测网络。两者的主要区别在于,二阶段网络先生成候选区域,再对这些区域进行分类与回归,而一阶段网络直接在生成锚框后进行分类与回归计算。二阶段网络的检测精度通常较高,但计算速度较慢;相对而言,一阶段网络的速度较快,但检测精度略有不足。以下介绍两种常见的目标检测算法:Faster R-CNN(代表二阶段网络)和FCOS(代表一阶段无锚框网络),并说明它们在图像缺陷识别中的应用。

2.3.1 Faster R-CNN

Faster R-CNN是经典的二阶段目标检测网络,由特征提取网络、区域候选网络(RPN)、ROI Pooling层以及分类和回归层组成。网络首先通过VGG16或ResNet等特征提取网络生成特征图,RPN网络在特征图上生成候选锚框,定位和分类目标。

RPN网络是Faster R-CNN的核心,通过特征图生成候选框而非直接在原始图像上生成,提升了计算效率。每个像素点生成多个锚框,网络进行前景与背景分类,并根据实际目标进行回归调整,输出目标位置。

Faster R-CNN使用ROI Pooling统一锚框尺寸,分类并调整位置。这种二阶段处理方式使其在复杂场景中具备较高精度,特别适用于接触网系统中对检测精度要求高的部件识别。

2.3.2 FCOS网络

FCOS是一种无锚框的一阶段目标检测网络,它通过逐像素预测的方式进行目标识别,避免了基于锚框的复杂参数调整过程。与Faster R-CNN不同,FCOS去除了锚框生成和处理的步骤,直接对图像中的每个像素进行分类与回归。这种方式不仅简化了模型结构,还提高了检测速度。

FCOS网络通过特征金字塔网络(FPN)来增强对不同尺度目标的检测能力。FPN将浅层和深层特征融合,使得网络能够同时关注到图像中的大尺度和小尺度目标,减少了漏检的可能性。FPN中的信息融合过程使得网络能够更加精确地定位复杂场景中的目标物体。FCOS引入了中心度分支(center-ness),通过计算预测点与目标中心点的距离,抑制那些远离目标中心的低质量预测框,进一步提升了检测精度。对于需要高效、快速处理的大规模图像数据,FCOS网络表现出色,适合应用于接触网吊弦的缺陷检测任务,尤其在实时性要求较高的场景中具备显著优势。

3.高铁接触网吊弦缺陷识别方法

3.1吊弦缺陷识别流程

在接触网系统中,吊弦的状态直接影响供电的可靠性和列车运行的安全性,因此,准确识别吊弦的缺陷对于维护高铁供电系统至关重要。基于深度学习的吊弦缺陷识别流程分为几个关键步骤:数据准备、图像预处理、目标检测与分类、结果输出与优化。首先,使用4C检测装置采集高清的接触网吊弦图像,经过人工标注和数据扩充,构建高质量的训练和测试数据集。然后,通过图像复原和图像增强等预处理手段,修复运动模糊、提升图像对比度,确保吊弦在图像中清晰可见。此步骤为后续的深度学习网络提供了更好的输入质量,增强了模型的鲁棒性。

使用深度学习网络(如Faster R-CNN和FCOS)对吊弦进行特征提取和目标检测。Faster R-CNN通过区域候选网络(RPN)生成候选框,再通过分类与回归计算,精准定位并分类吊弦状态。FCOS网络则采用无锚框的逐像素预测方式,简化了模型结构并提升了检测速度。同时,通过特征金字塔网络(FPN)的多尺度融合技术,增强了对大尺度和小尺度吊弦目标的检测能力。最后,检测结果经过分类和置信度筛选,输出吊弦的位置信息和状态标签。该流程通过深度学习技术,有效提高了检测的准确性和效率,为高铁接触网系统的运行维护提供了有力支持。

3.2数据集构建与图像预处理

吊弦缺陷识别中,构建高质量的数据集是确保深度学习模型有效性的关键。首先,从4C检测系统采集包含正常、松弛、断裂等状态的高清吊弦图像,涵盖不同光照、天气和角度。人工标注吊弦位置及缺陷类别,生成带标签的训练和测试数据集,确保标注准确性和一致性。

为提升模型鲁棒性,图像预处理至关重要。通过去模糊技术解决图像模糊问题,利用直方图均衡化调整亮度和对比度,增强吊弦的可见性。此外,图像旋转、缩放、添加噪声等数据扩充技术可增加训练数据的多样性,防止模型过拟合。

经过预处理的图像更适合Faster R-CNN和FCOS网络进行训练,优化后的数据提升了特征提取和目标检测的准确性,确保模型具有更好的鲁棒性和泛化能力,为高精度的吊弦缺陷识别提供了坚实基础。

3.3特征提取与锚框优化

特征提取是吊弦缺陷识别的关键步骤,决定模型能否有效提取语义信息。卷积神经网络(如VGG16、ResNet)通过多层卷积操作提取吊弦图像中的低层次信息(如边缘、颜色)和高层次信息(如形状、结构),识别正常吊弦与缺陷吊弦(如松弛、断裂等)。生成的特征图为目标定位和分类提供了基础。

在目标检测中,锚框对定位精度至关重要。Faster R-CNN通过区域候选网络(RPN)生成候选锚框,K-means聚类算法则根据数据优化锚框大小与比例,提升候选框与真实目标的重合度,减少误检与漏检。

FCOS网络则采用无锚框设计,逐像素预测目标位置和状态,借助多尺度特征金字塔(FPN)和中心度分支,增强了对小目标和复杂场景的检测能力。相比锚框网络,FCOS减少了参数依赖,通过优化回归和分类提升了吊弦缺陷检测的性能。

3.4基于FCOS的缺陷识别优化

在吊弦缺陷识别中,FCOS(全卷积单阶段目标检测)网络通过无锚框设计和逐像素预测机制,简化了传统锚框生成和调整的复杂过程。FCOS去除了锚框,直接在特征图的像素点上进行分类和回归,提高了检测速度,特别适合实时性要求高的任务。通过预测像素到目标边界的距离,FCOS避免了锚框比例不当带来的检测误差,能够直接识别吊弦的多种状态,如正常、松弛和断裂,从而提升识别效率。

为进一步优化,FCOS引入特征金字塔网络(FPN),通过融合浅层和深层特征,实现多尺度目标检测,特别是在小尺度吊弦检测中表现突出。浅层特征保留了细节信息,深层特征提取语义信息,确保在复杂场景中既能识别大目标,又能减少对小目标的漏检。FCOS还通过中心度分支提高了定位精度,抑制偏离目标中心的低质量边界框,确保最终输出的边界框更接近目标实际位置。该设计使FCOS在提高检测速度的同时,保持了高准确性和可靠性,成为吊弦缺陷检测中的高效选择。

3.5吊弦缺陷分类与检测

吊弦缺陷分类与检测是深度学习模型应用于接触网系统的重要环节。通过FCOS或Faster R-CNN网络提取吊弦图像特征,将吊弦分类为正常、松弛、断裂等缺陷。FCOS利用逐像素预测进行分类,而Faster R-CNN通过生成锚框结合区域建议网络(RPN)进行定位和分类,有效区分不同缺陷状态。

分类后,模型对检测框进行回归计算,调整其位置和大小。Faster R-CNN通过锚框优化候选框,FCOS通过像素点到目标边界的距离生成边界框,提升定位精度,减少误差。

分类和检测完成后,模型输出每个吊弦的类别、边界框及置信度,通过设定阈值筛选高置信度目标,减少误检漏检。检测结果可用于吊弦状态监控,帮助维护人员及时发现故障,提升接触网系统的智能化维护能力。

4.结果分析与结论

4.1实验结果与性能分析

在实验结果与性能分析中,本文评估了基于Faster R-CNN和FCOS的吊弦缺陷识别方法。通过4C系统采集的大量吊弦图像构建训练和测试数据集,涵盖正常、松弛、断裂等状态。Faster R-CNN在测试中表现出色,特别是在小目标和多目标场景,准确率达96.59%,召回率达97.19%,有效减少了漏检和误检。

相比之下,FCOS网络因无锚框设计和逐像素预测,检测速度更快,适合实时性要求高的场景。尽管FCOS在部分复杂场景中的定位精度略逊于Faster R-CNN,但其简单结构和高效率使其适用于快速检测任务。总体来看,Faster R-CNN适合高精度需求场景,FCOS则在实时场景中表现更佳。

4.2算法优劣分析

在算法优劣分析中,Faster R-CNN和FCOS各有优缺点。Faster R-CNN作为二阶段检测网络,通过RPN生成锚框,定位精度高,尤其在小目标和复杂场景中表现出色,适合高精度任务。然而,其复杂结构导致检测速度较慢,处理时间长,难以满足实时性要求。

相比之下,FCOS作为无锚框的一阶段检测网络,采用逐像素预测,简化了检测过程,显著提高了速度。通过特征金字塔网络(FPN),FCOS在小目标检测中表现良好,但在重叠或密集目标场景下,定位精度略逊,误检率较高。总体而言,Faster R-CNN适合高精度任务,FCOS更适合速度要求高的场景。

4.3研究总结与展望

本研究基于Faster R-CNN和FCOS的吊弦缺陷检测方法取得了显著效果。通过对4C系统采集的图像进行特征提取、定位和分类,Faster R-CNN在复杂场景中表现出色,减少了漏检和误检;FCOS凭借无锚框设计和逐像素预测,大幅提升检测速度,适合实时检测需求。两种算法的性能差异表明,它们适用于不同的应用场景。

未来研究可通过改进特征提取网络或引入更先进的架构,提升检测精度与效率。针对目标重叠和密集问题,可结合多目标跟踪技术优化算法,减少误检。同时,引入更多实际应用数据,提高模型的鲁棒性和泛化能力,为接触网系统提供更强的智能监测支持。

参考文献

[1]于阳.基于深度学习的缺陷识别算法设计[J].信息与电脑(理论版),2024,36(12):95-98.

[2]温柏康.基于图像识别与深度学习的接触网吊弦缺陷识别研究[D].兰州交通大学,2023.

[3]杨自华.基于深度学习接触网设备缺陷识别的研究[D].中国铁道科学研究院,2022.

[4]金格.高铁接触网吊弦及管帽的定位及异常状态检测[D].石家庄铁道大学,2020.

*本文暂不支持打印功能

monitor