
- 收藏
- 加入书签
基于LM神经网络算法的细粒度用电数据对多元经济脉动值复杂影响机制的研究
1.研究背景
用电量有着经济运行“晴雨表”和“风向标”之称。透过用电数字“触摸”经济发展的脉动,是科学认识判断经济形势的理想方法。然而经济脉动值具有很强的时序性和产业类别依赖性,导致预测难度增大。故利用先进智能算法,针对细粒度用电数据,实现多元经济脉动值的实时预测并提高预测精度,是现阶段急需解决的重要科学问题。
本文围绕多元产业下产值的实时高精度预测开展研究,设计面向六大类工业企业,以月份为单位采集用电数据,基于LM神经网络算法针对细粒度用电数据构建多元化企业产值得预测模型,突破输入层动态优化、产业类别逆循环分段识别、经济脉动值实时智能预测等核心技术,实现通过复杂用电数据对多元产值的实时精准预测,达成对经济形势的科学认知。
2.原始细粒度用电数据特性
本文涉及的用电数据为以月为单位的真实南沙区用电数据。其优点在于,真实且时间间隔较短,以月为单位的用电数据在可模拟范围内最大限度的细化用电特性。然而数据中的缺点也十分明显,首先,数据中真实记录了大量无产值和用电量的情况,这些数据真实但无效,对神经网络的训练甚至会造成错误影响。其次,数据中错误记录了大量有用电量和而无用电量的情况,这些数据是采集失误造成的,与实际情况不符,对神经网络的训练会造成错误影响。最后,数据中错误记录了大量负值用电量,与认知可能相悖,必然对神经网络的训练造成错误影响。
在以年或更长时间阶段为单位的用电数据与产值的相对的粗糙预测工作中,上述问题均可通过产值加和有所解决。但是在本研究中涉及的细粒度用电数据精准预测方法,则需要保证数据更高的严谨性,上述错误数据均在预处理中被清洗,以适应神经网络的训练。
剔除原始数据中的无效数据与错误数据既可完成数据的预处理,预处理后的数据正确且多元,主要涉及家具制造业、化学制品制造业、医药制造业、非金属矿物制品业等数十个行业类别涵盖数百家各异企业。
3.LM神经网络构建
LM神经网络模型主要从输入层、隐含层、输出层和各层之间的传输函数几个方面来考虑。
(一)输入数据的维数优化
输入层起缓冲存储器的作用,它接收外部的输入数据,因此其节点数取决于输入矢量的维数。同样,输出层的维数也是由问题所直接决定的。
本研究中输出层即为预测的下月产值,所以输出数据的维数为1。输入层即为之前各个月份的用电量,如果取预测产值前一个月的用电数据为输入数据,则输入数据维数为1;取前两个月的用电数据为输入数据,则输入数据维数为2,以此类推。
输入数据维数越大,则所取用电数据月份越多,数据越完整。但是数月前的用电数据未必对当月产值产生影响,相关度较低的数据反而会对网格训练造成负面影响。
为了优化神经网络结构,选择合适的神经网络输入数据维数,本项目通过遗传算法选取较优的1、2、3、4、8、10、20和40维数,对上述维数下神经网络针对用电数据对产值的预测过程中的训练、验证和测试情况的误差进行分析,结果如下图所示。
4.LM神经网络训练
在确定结构基础上,本研究通过变换时间节点,应用大量数据训练神经网络,不断降低误差值,最终得到数据误差集中在最小值域内的训练结果,训练过程中误差由分布式大误差直方图转为集中直方过程如下图所示。