- 收藏
- 加入书签
基于ResNet网络的抽油机故障诊断研究
摘 要 抽油机故障诊断技术是采油工程中的重要组成部分,由于抽油机井下工况条件复杂,整个生产过程呈现强耦合、非线性和参数动态时变等特性,一旦发生故障,难以及时准确的给出诊断结果,造成财产损失甚至危害人身安全。因此,建立一套准确有效的抽油机故障诊断系统具有重要的应用价值。
本文中,我们使用ResNet网络对不同故障下抽油机传回的示功图进行分类处理,从而完成对抽油机故障的识别诊断工作。
关键词:抽油机;ResNet;示功图;
第一章 绪论
1.1 研究目的和意义
能源问题制约着国民经济的发展,而石油一直是重要的能源之一。目前各油田的原油开采都已经进入到中后期,开采难度越来越大,成本也越来越高。使用最为普遍的抽油机通常运行在环境恶劣的环境中,复杂的井下工况条件导致抽油机在运行过程中发生故障,且不易被察觉。抽油机传回的示功图图像数据可以作为基本数据集训练图像分类网络,从而及时对故障进行诊断。
因此,本项目使用深度残差网络对抽油机示功图图像进行分类研究,进一步开展抽油机故障诊断研究,这对于保证油田实际生产具有重要意义[1-2]。
1.2 抽油机故障诊断及图像分类技术概述
1.2.1 诊断技术分类
故障诊断就是监测机械设备运行状态,发生故障时及时查找故障源,并制定相应策略的一门学科[3],按其方法可分为基于解析模型的方法、基于信号处理的方法、基于知识的方法三种:其中基于解析模型的方法包括状态估计、参数估计、等价空间;基于信号处理方法包括频谱分析、概率密度、相关分析;基于知识包括神经网络、专家系统、模糊数学、数据驱动、融合诊断。
随着计算机网络的飞速发展,抽油机故障诊断技术越来越趋向于智能化,主要有以下几个阶段:地面示功图分析法、井下示功图分析法、计算机诊断法、专家系统诊断法、人工神经网络法。
1.2.2 图像分类技术简介
图像分类作为应用在并实现土地利用分类的关键技术,也是提高上述工作精
度和效率的关键所在,其本质是数学建模中的图建模:基于统计方法(或其他方法)构建适配任务的图像分类模型,是统计学的重要内容之一。
图像分类简单来说就是利用分类算法对图像数据进行拟合,并利用拟合好的分类器对图像数据进行识别和分类的过程。图像分类的流程大致可以总结为:对图像数据集进行预处理;利用特征提取算法提取图像的特征;利用分类算法对提取的图像特征进行识别和分类。现阶段图像分类的研究主要集中在图像特征提取和分类器设计。
第二章 文献综述
2.1 ResNet网络系列模型
ResNet由何凯明等人提出,他提出了一种残差的学习框架,通过使用捷径方式连接构造出残差单元,来跳过卷积层模块,从而可以训练更深层次的网络。这些堆叠的残差单元极大地提高了模型的训练速度,并通过采用BN和MSR在很大程度上解决了梯度消失问题。ResNe的健壮性己在各种视觉识别任务和非视觉任务中得到证明。实验表明,使用残差块可以有效提高收敛速度和精度。
在T4GPU下,14个预训练模型的Accuracy, FLOPS and Parameters等重要参数效果如表2.1所示。
从表2.1可以看出,飞桨平台训练出的ResNet模型准确率与参考值相似,且速度较快,同时飞桨平台中的PaddleClas模块使得模型调用更加便捷,本项目将依靠飞桨平台对模型进行训练,完成预测任务。
2.2 示功图典型故障特征
理论示功图假设抽油机运行在井下理想的工况条件下,抽油杆只承受自身重力及抽油杆柱与活塞面积以上的液柱的静载荷,而得到的表征位移与载荷关系变化的示功图。典型的理论示功图是具有对称结构的平行四边形,是抽油机在一个抽吸过程中所绘制的位移、载荷关系图。
抽油机运行过程中,由于所处的地理环境恶劣、复杂的井下工况条件的影响导致抽油机可能发生各种各样的故障,影响到正常的原油开采工作。通过油田工作者对大量不同故障示功图分析对比之后统计出抽油机在井下发生的故障可以分为以下类型:供液不足、气体影响、气锁、上碰泵、下碰泵、游动阀关闭迟缓、柱塞脱出泵工作筒、游动阀漏、固定阀漏、砂影响、惯性影响。通常通过面积法来确定故障的类型,面积法中首先需要把示功图划分成4个不同的部分,4个部分分别为A1,A2,A3,A4。
当抽油机出现故障时,示功图的4个部分会发生显著的变化,部分典型故障下的示功图如下:
(1)供液不足
抽油泵的抽吸工作不正常,参数设置不合理,使得液体无法充满抽油泵[7],绘制得到的示功图形状类似于“刀把状”。
(2)气锁
泵筒中突然充入大量的气体,上冲程阶段气体快速发生膨胀,此时,气体会占满柱塞上冲程过程中所留下的体积空间,由于内部压力小于外部油层中的压力,将会是固定凡尔无法正常打开。
下冲程阶段时,虽然随着活塞的运动气体开始往外压缩,但是由于游动凡尔上部压力仍然大于泵筒中的压力,导致游动凡尔打开时间滞后或者根本无法打开,泵无法正常排油,严重影响到采油效率。
(3)柱塞脱出泵工作筒
示功图中S3,S4部分缺失,图像呈现出水平状,只集中在最大载荷附近。原因是由于抽油杆发生弹性疲劳以及卡泵等影响,使得抽油杆超过了本身的最大拉伸极限,或者是由于抽油杆之间连接松动,发生脱扣,发生抽油杆断脱会导致抽油机无法正常采油。
第三章 基于Resnet网络的示功图分类方法
3.1 数据集及预处理
数据集由1万7千张左右的实际生产示功图构成,图像分辨率为400*190,RGB通道数为3,图像来源于某油田的现场设备传回的数据,并将图像数据分为12种类别:工作正常、供液不足、气体影响、气锁、上碰泵、下碰泵、游动阀关闭迟缓、柱塞脱出泵工作筒、游动阀漏、固定阀漏、砂影响+供液不足、惯性影响+工作正常,不同类型下的示功图数据中存在较为明显的差异,ResNet可通过识别图像数据中的特征差异,对示功图进行分类,从而诊断抽油机故障。
为了更好的抓取图像特征,从图像中可以看出每种示功图可以看做一类多边形,读取图像时,将图像转为灰度图像进行读入,将RGB三通道彩色图像转换为一通道灰色图像。
3.2 ResNet网络模块简介
ResNet系列模型于2015年提出,在ILSVRC2015竞赛中以3.57%的top5错误率获得冠军。该网络创新性地提出了残差结构,通过堆叠多个残差结构构建了ResNet网络。实验表明,使用残差块可以有效提高收敛速度和精度。
3.2.1 残差块计算
ResNet通过应用快连接实现跳过几层的连接操作,例如,我们将数据x添加到输出中,让不断堆叠的非线性层匹配的其他映射,从而将原始映射转变为,拟合目标为,训练目标为,即所说的残差。这种网络的训练方式与普通网络相同,没有其他任何参数的加入,缓解深层网络中的梯度爆炸和梯度扩散等问题。
残差结构可用以下形式表示:
通过递归,深层单元L特征的表达为:
通过反向传播的链式法则可得出倒数可划分为两个部分:一部分通过权重层进行传递,另一部分不通过权重层传递。前者对信号直接传回浅层提供了保障,同时也避免了梯度消失现象。
3.2.2 卷积层
卷积层按照图3.2(1)的计算操作可进行图像的特征增强工作,降低了图像的噪声,以便对图像复杂性特征进行更好的学习。
3.2.3 池化层
图3.2(2)的方式将池化窗口区域内的最大值作为样本区域池化后的值,对样本特征信息再次过滤,进一步缩小特征矩阵,缩减后面的全连接神经网络的参数数量,降低网络的内存占用和计算量。
3.2.4 全连接层
以特殊的结构对图像特征进行最后的特征分类计算,作为卷积神经网络计算的最后一步,全连接神经网络受神经元数量影响,参数多且计算量大,同时利用激活函数对特征进行映射计算,对特征进行再次整合,提供更为精准的分类依据。
3.3 ResNet网络结构的确定
我们将分类好的图像数据作为数据集,按照70%训练集,30%测试集的方式划分数据集进行模型的训练与测试。在ResNet网络体系中,选择ResNet50最为合适,低于50层的ResNet会出现特征抓取不全,从而导致欠拟合,而ResNet101等更深层的模型可能会抓取多边形外的冗余特征,造成过拟合现象,影响最终的准确率,因此,本文选择ResNet50作为分类网络。
关于ResNet的不同结构,所有的ResNet网络都分成5部分,本文采用的ResNet50网络使用Bottleneck结构层,与ResNet18等浅层次网络不同,每个Bottleneck都会在输入和输出之间加入了一个卷积层,避免图像通道数扩展而造成输入一定但输出尺寸不同的问题,此外,ResNet block2中,图像输入尺寸发生变化,需要加入downsample[11]。
3.4 激活函数
激活函数可以是线性或非线性的函数。通常在神经网络层使用或是构建激活层,且大多数激活函数为非线性的,激活函数通过对输入数据进行非线性变换,可以使网络学习和执行更为复杂的任务,本文主要使用两种非线性激活函数:ReLU函数和SoftMax函数。
1)ReLU函数
ReLU是最常用的激活函数,它采用实值输入并将其阈值设置为0(将负值替换为0)。当x<0时,输出为0,否则输出为x。这种激活使得网络收敛更快。当x>0时,函数不会饱和,神经元至少在其区域的一半不会反向传播所有0。
ResNet网络中完成归一化操作之后,dyingReLU的问题不会轻易出现,因为任何一个神经元规范化操作之后的输出都有正有负。此外,一个图像压缩成小特征样本后进行分类,ReLU函数不容易丢失信息,准确率会有所提升。同时,两层ReLU也是有万有逼近能力的,条件是节点足够多,在参数量足够多的情况下大多数添加参数的方法或是提高模型复杂度不能带来明显提升,且其他所有改进会出现性能开销,因此,本文选择ReLU函数作为网络主要激活函数。
2)SoftMax函数
其中
SoftMax函数通常用于网络的最后一层,且SoftMax层需要具有与输出层相同数量的节点,它可以将线性输入转换为概率,之后输出所有类别的“概率”,并且概率累加和为1。
3.5 目标函数
本项目使用平方误差总和即L2函数,目标数据与网络估算值之间的差计算总体损失,并将其最小化。模型网络中,我们计划将权重的误差减至最小,找到权重与偏差的最佳组合,最小化训练集上的损失函数。数据经过投影之后,在低维空间里,同类样本聚集在一起,不同类的样本相距尽可能远。类内差异用每个类的方差来衡量,类间差异用各个类的类中心之间的距离来衡量,我们要优化的目标可简化为类内差异与类间差异的比值。因此,目标函数如式3.3所示
为避免局部最优值等问题,我们采用余弦退火算法,学习率初始值设定为0.1,在训练过程中以一种十分有效的计算方式动态提高或降低学习率,跳出局部最优值并找到全局最优值的路径。
3.6 模型训练
整个ResNet网络模型的结果及构建基于python语言及paddle飞桨框架,采用分批次训练的方式,每次训练随机不重复的选取64张图像输入进网络中,得到其损失函数及训练准确率曲线,该曲线表明准确率在训练次数1500次以前上升趋势明显,之后准确率稳定在0.98左右,损失函数一直呈下降趋势,训练次数为8700次时最小,达到0.005。
网络训练完毕后,需要对网络性能进行评估,将验证集输入进训练好的网络中,验证集准确率达到0.98,训练集与验证集准确率相差很小,说明此网络不存在过拟合,网络性能良好,能够非常准确的抽油机故障进行诊断。
第四章 实验验证
依据本文模型算法思想,确定了实验中所用的ResNet的网络结构以及目标函数等重要参数,同时进行模型训练与测试,为了验证本文所提算法的有效性及优越性,我们基于相同的训练集和测试集,对本文提出的模型进行调参,同时与SVM、决策树、人工神经网络、ResNet101网络的分类结果进行对比分析。
4.1调参
学习率初始值设定为0.1,衰减系数为0.9,batch_size设置为64,由于采用ResNet50模型,对上述3个参数进行调整,此外,还采用k折交叉验证法,控制训练集与测试集的划分,保证数据集划分的随机性,最大化保证模型的泛化能力。
学习率
学习率从0.1开始尝试,分别试验0.1,0.2,0.3,0.4,0.5五种学习率值,实验中发现当模型学习率超过0.2时,准确率较0.1时有所下降,同时当学习率初始值设定为0.5时,出现Nan值。
衰减系数
分别设定0.1,0.3,0.9三种衰减系数,当验证集准确率不再上升时,确定衰减时间,防止出现局部最优值的问题,以损失函数值为指标,最终选择0.9作为衰减系数。
Batch_size
本项目数据集内数据较多,因此batch_size选择从64开始,分别设置64,128,256,512这4个取值,以测试集准确率为指标,对这4个取值进行测试,最终确定batch_size为64时,准确率最高。
4.2 结果对比分析
ResNet50与ResNet101均属于CNN,可以直接将图像输入,SVM、决策树、神经网络需要将图像转为数值矩阵进行输入。几种模型的结果比较如下:ResNet50的分类精确度为98.2%,所用时间126s;ResNet101的分类精确度为94.1%,所用时间278s;决策树的分类精确度为82.6%,所用时间87s;SVM的分类精确度为83.3%,所用时间95s;人工神经网络的分类精确度为87.5%,所用时间115s。
从中可以看出,以上模型均可有效地对示功图数据进行分类,但是整体上ResNet50模型的分类效果要由于其他模型,分类效果最优。
ResNet50算法对于示功图的分类效果要优于上述模型,同时,网络训练时间适中,具有一定的实用价值。为了构建更为稳定的ResNet网络模型,应依据实际问题确定网络的深度。
第五章 结论
本文基于ResNet的抽油机故障研究,得出以下结论:
1. 本文主要利用抽油机示功图与ResNet网络结合的方式对抽油机故障进行诊断,实验结果表明,与一些机器学习算法,例如SVM、决策树算法相比,本文采用的模型对于不同故障下的示功图具有更好的分类效果,能够有效诊断抽油机故障。
2. 本文为了试验救过更加精确以及减少局部最优现象的发生,在模型结果上加入动量因子,动态改变学习率及下降路径,保证准确率,最终模型的预测结果达到98%以上。
3. 经过对比试验分析,本文的研究成果具有一定的应用价值,操作简易,且准确率较高,可通过示功图诊断抽油机故障,协助工作人员对抽油机及时检修,降低经济损耗。
参考文献
[1]于德亮,李妍美,丁宝,赵鹏舒,孙浩.潜油柱塞泵MMAGA-RBF故障诊断方法[J].哈尔滨工业大学学报,2017,49(09):159-165.
[2]仲志丹,李鹏辉,郭苗苗,王劲松.石油生产中有杆抽油机故障诊断研究[J].计算机仿真,2016,33(02):443-447.
[3]王琼. 基于优化理论的神经网络研究及在抽油机故障诊断中的应用[D].东北石油大学,2011.

京公网安备 11011302003690号