- 收藏
- 加入书签
基于GWO-SVM的制造业高质量发展评价模型构建
摘要:本文通过介绍SVM和GWO的理论基础以及它们的主要算法,并指出两种算法存在的弊端。为了让SVM获得更准确的分类处理,通过用GWO算法对SVM进行改良,改良后的模型可以具备自适应参数的能力。SVM的惩罚因子和参数值在进行优化后,成为了GWO-SVM的混合模型,提高了评价精度以及分类能力,以便应用于制造业高质量发展的评价指标体系中。
关键词:支持向量机;灰狼算法;制造业高质量发展
1 GWO-SVM混合模型构建的目的
模糊评价、神经网络都可用于对制造业高质量发展的评价,但这些方法都存在一定的不足。其中,模糊评价的自学及自适应能力不强,在计算模糊矩阵时比较复杂;尽管神经网络的学习泛化能力相比于模糊评价更强,但在参数的设置过程中太过于繁琐,加上其在学习过程中需要将风险控制到最小,难免发生过度学习的情况,大规模数据集以及小样本数据集使用神经网络方法得到的效果不明显。对于这两种方法存在的缺陷,制造业高质量发展评价需要一种有着较强自学和自我泛化能力的智能算法。
在机器学习的方法中,支持向量机注重控制结构风险,泛化能力、模式识别、回归分析、时间预测等能力较强,在智能评价、自然或者社会现象评价中取得不错的效果。
但是,由于在使用SVM进行对象评价研究时,往往因为模型比较单一,从而会出现比如难以构建最佳模型、参数获取困难等情况的出现,SVM在功能上还是存在一些缺陷。比如,在进行网络搜索以及梯度搜索等过程中,由于参数在更新的不当,难免会在输出局部最优解的结果。为了改进这些不足,可以从近几年研究来看,很多研究者将SVM与其他的智能学习算法相结合起来,构建混合的模型结构,从而提高SVM在进行参数的搜索的能力以及输出结果的正确率。多种智能学习算法相结合的思路可以为各种评价和研究提供创新。
目前,遗传算法、蚁群算法等广泛应用在研究工作中,但是这些智能算法都存在收敛速度慢、局部最优解等缺陷。相类似型的智能算法中,在2014年提出的灰狼算法(GWO)有着收敛速度快,收敛能力、优化能力强等特点,得到广泛的关注,许多学者将这类算法应用于研究工作中。本文尝试将GWO算法对SVM 方法进行优化,让SVM提高寻求最优解的能力,用GWO改进支持向量机自适应参数的能力,从而构建一种全新的基于制造业高质量发展评价的GWO-SVM混合评价模型,并应用于制造业高质量发展评价中。
2 GWO-SVM混合模型理论基础
2.1 支持向量机(SVM)
2.1.1 SVM概述
最早提出支持向量机(Support Vector Machines,SVM)的是Bell实验室的一个研究小组。他们在进行小规模样本机器学习方法研究时,发现一种的更优分类模式识别方法,该方法可以对未知样本完成最小分类误差,它基于统计学中的VC维理论和结构风险最小化理论的原理。其可以折中小样本处理、模型复杂以及自学习的关系,具有模型简洁、泛化能力强的特点,可以很好的适用于小样本处理、数据挖掘等领域。从原理上来说,受约束的二次规划(Quadratic programming,简称QP)问题可以用SVM算法来解决,在不等式约束下的二次规划问题求解过程中,为了得到最优的分类结果,让最优分类超平面使结构风险最小化,将核函数线性不可分问题和高维空间的线性可分问题相转换。再使用牛顿法、内点法等求解规模较小的二次规划问题的最优解。SVM算法在面对规模较大的QP问题时,因为规模比较大、数量多的问题,所以在训练过程中就会出现速度慢、参数选取困难、计算量大、出错率高等问题。为了解决这类问题,很多的研究学者就是将大规模的QP问题拆分为多个小规模的QP问题用SVM算法进行求解,最后将所有的小规模的QP问题解构建出大规模的QP问题的相近解。由于在将大规模QP问题分解成小规模的QP问题时很困难,所以,将SVM训练算法成熟化对于解决以上困难有极其重要的意义。
2.1.2 SVM基本原理
2.2 灰狼算法
2.2.1 灰狼算法简介
在进行研究工作的过程中,研究者可以根据物种的群体行为和习惯提出与物种行为相类似的研究方法,其中衍生出来的算法叫做群智能算法。这些算法兼具灵活运用、结构简洁、可视化、参数少、易操作、适用性强等特点,而且这类算法可以改进和优化参数减少结构的复杂性等。经常被的学者用于相关领域的研究。
灰狼算法(Wolf Algorithm,GWO)于2014年由Mirialili首先提出,是根据狼群的群体行为提出的一种较新的群智能优化算法。GWO是随机搜索的算法,其这一特点与粒子群优化算法(PSO)相类似,它们都是以大概率的原则作用于对所有最优解的收敛。但是,和PSO、网格搜索算法等算法相比,GWO在参数选取上数量较少,结构比较简洁,还具有更强的收敛性等特点。该算法是根据和模拟灰狼种群在狩猎的方式和经过,借助和考虑灰狼狩猎目标的思维和策略以及路线如何选择等多重因素综合的算法思维,达到灰狼为狩猎到食物选择的最优策略算法。和传统的那些群智能算法相比,GWO的结构简洁、计算不复杂、参数少、全局择优、反应速度快等长处,这些年来得到许多研究及学者的关注和应用。
灰狼种群的等级制度很严格,主要分成四个等级分别为:α、β、δ。α等级是灰狼种群最高级别,相当于狼群的首领,其他的级别受它的统治和支配,具有狼群内全部事务的决定权,主要的工作就是带领和指挥狼群对猎物发起跟踪、狩猎等。灰狼群的第二等级是β级,被α指挥和领导,领导和指挥 δ、ω两个等级。同时辅助α,传达α的指令给δ、ω等级,起到监督的作用。δ是灰狼群的第三等级,被α、β指挥和领导,领导ω等级。ω作为灰狼种群的最低等级,被其他等级的领导,主要工作为狩猎。
2.2.2 灰狼算法基本原理
GWO算法的样本选取是随机产生的,相当于随机选择一群灰狼,在多维空间中追踪狩猎,追捕的猎物相当于算法样本中的最优解,在计算的过程相当于反复的迭代,符合度排在前三(α、β、δ等级)的样本被保留并下来,其他被剔除,从而在不断的迭代过程中得到最优解(猎物)方位,没被剔除的灰狼个体确定自身和猎物的距离,不断朝猎物方向移动。因此,需要计算出灰狼和猎物之间的距离:
式(5)表示灰狼与猎物之间的距离公式;式(6)表示灰狼当前位置。其中,t、XP、X、A、C分别表示迭代次数、猎物的位置、灰狼的位置、参数、向量。
在计算过程中需要假设α狼, β狼和δ狼三个等级可能出现的位置。所以,每次迭代过程后,当次α狼、β狼、δ狼这三头狼的位置需要被保留下来,最后其他等级的狼群按照这三头狼的位置判断出猎物方位并向该方位靠近,实时更新当前所在位置,更新式为(式中为α狼与猎物的距离和所在位置,β、δ狼的计算过程相同):
其中,A是[-2a,2a]区间上的随机向量,a是线性递减参数(2到0递减),当A的值在[-1,1]区间时,灰狼接下来的位置会随机现在它和猎物之间的位置上。在确定α狼、β狼和δ狼的位置后,狼群会更具位置和距离信息来追踪猎物,主要表现为先分开在聚集等形式。
为了避免没有实现全局搜索,A的值可以用[-1,1]以外的随机值来表示灰狼搜索期望空间以外的地方。可以看出,随机行为是整个GWO算法过程中的主要特点,从而保证GWO算法的全局搜索能力。
3 GWO-SVM混合模型构建及步骤
3.1 模型构建
因为SVM模型惩罚因子C表示最优超平面对样本进行分类时对错分的容忍程度,所以,C值可以直接反映了SVM分类的效果和模型简易程度。可以知道,当C越大,数据集在训练的过程中分类效果越好,但是,当分类组之间的间隔很小时,难免会出现过度学习或过度拟合的情况,从而降低了分类器的泛化水平。相反,当数据集在训练过程中出现很大的错分概率时,分类效果不好,使得分类组之间的间隔较大,就会出现拟合效果不佳的情况,从而降低了分类器的泛化水平。
g的变化影响着高斯核函数的数值,其作用是确定原始数据特征空间和高维数据特征空间的映射关系。当g变大时,高斯核函数的数值将变小并不断趋向于0,尽管SVM可能把测试的样本做到完全正确的分类,但是由于分类时会出现超平面趋向繁琐化,从而会降低SVM模型的泛化水平。g变小时,SVM判别式的值不断向1靠拢,就会出现SVM模型将全部训练样本分类成样本最多的一类的情况,使得SVM模型得不到效果好的泛化水平。因此,SVM在样本训练的泛化水平高低取决于得当的惩罚因子C以及核函数σ的选择。可以通过使用GWO算法对SVM参数进行优化解决这类难题。
3.2 模型构建步骤
(1)在将实验的数据输入之前,由于在分类过程中受到量纲的影响,因此原始数据需要做归一化处理。
(2)按照设计好的比例将整个数据样本按进行随机分为训练样本集和验证样本集,训练样本集用来训练模型,验证样本集用来对模型评价验证和改良。
(3)灰狼的位置参数用参数C和参数g表示,定义灰狼的种群数量n、个体等级、定义参数的范围、设计迭代次数。
(4) SVM模型可以通过参数C和参数g在训练样本集上得到,得到模型后还需要对验证样本集进行定义以及分类,每匹狼的等级根据分类的效果或准确率作为依据。
(5)将灰狼种群按照分类效果选出α,β,δ和ω共4个等级。
(6)根据式(5)~式(9)更新狼群中每个灰狼位置。
(7)根据迭代的次数判断是否结束寻优,如没有结束就回到步骤(4)进行循环,直到迭代寻优结束。
(8)迭代结束,输出最C和g的值表示最优狼位置。
4 结束语
在进行事务评价的过程中涉及到很多指标因子和参数,加上出现相关的数据缺失、数据不完整、搜集困难以及样本数量少的情况,因此采用一些智能算法并不可行。但是SVM具有对小样本有较强的自学习和分类能力,因此,在进行事务评价时选择SVM算法建模可以得到较好评价结果。但是,由于选取适合的参数难以把握,从而使SVM算法可能陷入局部最优解的情况,所以非常有必要对该算法进行优化。GWO具备有全局寻优能力特点,因此将GWO引进SVM,使改良后的SVM不仅具备原有的小样本数据分类能力,还具备了GWO全局择优的优点,并优化SVM模型参选择,构建了一种全新的GWO-SVM制造业高质量发展评价混合模型。GWO-SVM这种全新的混合模型不仅为制造业高质量发展评价,也为其他小样本问题的评价工作,提供了一种较优的评价模型和评价思路。
参考文献:
[1]赵东. 基于群智能优化的机器学习方法研究及应用[D].吉林大学,2017.
[2]石志标,陈峰.基于集合经验模态分解和支持向量机的滚动轴承故障诊断[J].拖拉机与农用运输车,2015,42(02):45-48.
[3]徐达宇,丁帅.改进GWO优化SVM的云计算资源负载短期预测研究[J].计算机工程与应用,2017,53(07):68-73.
[4]Li Jie, Zhang Qiuwen, Yongzhi Zhang, et al. An intelligent feature selection and classification method based on hybrid ABC-SVM[J]. International Journal on Smart Sensing and Intelligent,2016, 9(4):1859-1876.
[5]VLADIMIR N. VAPNIK.An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.
[6]宋玉生,刘光宇,朱凌,王坚.改进的灰狼优化算法在SVM参数优化中的应用[J].传感器与微系统,2022,41(09):151-155.
[7]MIRJALILI S,MIRJALILI S M,LEWIS A.Grey wolf optimizer[J].Advances in Engineering Software,2014,69:46-61.
[8]罗佳,唐斌.新型灰狼优化算法在函数优化中的应用[J].兰州理工大学学报,2016,42(03):96-101.
作者简介:
张运(1982.01-),男,湖南桃江人,湖南工业大学副教授,博士研究生,主要研究方向:经济统计、风险管理与金融统计。
韦迪(1998.05-),男,广西南宁人,湖南工业大学硕士生,主要研究方向:供应链风险。
基金项目:湖南省教育厅科学研究项目“制造业高质量发展评价的模型构建与实证研究”(项目编号:20C0605)


京公网安备 11011302003690号