• 收藏
  • 加入书签
添加成功
收藏成功
分享

面向配电网大数据的自组织映射知识融合算法

田中亮
  
格调·建筑设计与管理
2022年13期
国网天津市电力公司东丽供电分公司 天津市 300000

摘  要:伴随着时代进步与社会发展,人们的物质生活水平显著改善,对供配电稳定性、持续性、安全性与可靠性也提出了更高的要求。知识融合是知识图谱的关键环节,也是支撑知识图谱可用性的重要因素,其核心为实体的消歧与解析。实体的消歧指大量数据中同义实体的抽取及分类,一般用于海量异构数据的实体融合;实体的解析指实体间或实体与属性间相互关系的分析,一般用于异构、同义实体的属性融合。

关键词:配电网大数据;自组织映射知识;融合算法

引言

近年来,各种先进量测、通信和控制技术密集应用在配电网中,其信息化程度迅速提高,导致信息系统对电力系统的影响日益增大。现代配电网状态感知、运行决策和经济运行越来越依赖信息系统的可靠运行,配电网已发展成为电力物理系统与信息通信系统深度融合的复杂动态系统。

1基于知识图谱与细胞自动机模型的配电网信息系统风险分析

近年来,电力企业通过多维度数据源信息的融合互通,初步实现配电网运行多层级的状态监测与管控。以省级配电网为例,每月在运行产生几十种类型高达数以TB的多源异构大数据,同时存在设备台账数据字段空缺和数据录入不准确等情况,导致难以充分发挥数据贯通、业务融合和资源共享优势,不能达到对配电网风险管控业务的有效支撑。而知识图谱技术能够实现对不同种类的文本、数据库、图片、视频等多源异构数据进行有效的信息抽取和知识融合,梳理数据之间的关联关系并实现知识合并和歧义消除,进而通过聚类整合大量知识信息,实现知识的质量评估和关联推理,形成简单清晰的<实体,关系,实体>三元组。这将为实现配电网中风险数据的深度挖掘和风险传播分析奠定良好的数据基础。在信息抽取过程中,主要以从SCADA、GIS等数据库和互联网中采集到的结构化数据源为基础,通过采集到的各种类型结构化数据提取出初步的实体信息,同时将半结构化及非结构化海量运行数据进行分类梳理,实现结合多个数据源的信息的互相印证和补充,从而实现对配电网运行风险数据的规范化融合,实现有效信息抽取。其次,在知识融合过程中,针对结构化数据和互联网数据通过知识合并获得进一步确切的实体分析,进而针对配电网中半结构化和非结构化时空数据,开展数据特征筛选与特征稳定性分析,从多维异态数据中提取基本特征,并在此基础上利用数据特征的交互融合分析实现实体歧义合并,为配电网信息空间中现有风险或潜在风险的全景评估奠定基础。最后,在知识加工过程中,根据知识融合后实体间的关联关系回溯发现风险成因和传播关系,从而进一步剥离错误实体,清理得出构建配电网风险分析的准确实体,并在精确推理、预测和评估基础上实现对配电网风险关联关系的刻画,最终构建融合实体和关联关系在内的三元组,以形成反映配电网风险的知识图谱。

2能源互联网多源数据融合技术

能源互联网是电力系统智能化的高级表现,是电力系统各节点紧密联系的新型电力网络。能源互联网的建设可以加强供需联系、整合电力系统交易、提高电力供应的稳定性和实效性。能源互联网的建设也为国家实现碳中和的目标提供助力。能源互联网属于“新基建”融合基础设施范畴,智能化、网络化、信息化是其主要特点。电力系统是由发电节点、输电系统、用户组成的。发电节点通过能源转换将化石能、风能、水能等一次能源转换成电能。然后通过输电系统输电线路,先升压后降压,将电能输送到用户处。输电系统还包括信息监测系统、通信系统、保护系统和调度系统等。而能源互联网是在此基础上将人工智能技术、通信技术、云计算等前沿技术的智能化电力系统,实现电力流全程的智能化控制。由于能源互联网内融合了大量的智能化设备,导致数据存在体量大、数据结构复杂、数据价值低、数据利用率低的特点。但是这些数据是能源互联网运行的忠实体现,通过深入挖掘可为能源互联网电力调度和系统调控提供数据支撑。利用电力企业构建的专用通信网络和5G通信网络作为连接纽带,将变电站自动化信息站连接。以现有的配电自动化主站平台构建智能配用电的大数据资源层的主节点,由于企业内外网的关系,将主节点分为电力系统内部主节点和外网主节点,并建立备用节点,提高系统的稳定性。主节点均配置有互为备用的冗余热备用节点,其他应用平台和资源作为从节点服从主节点的调度和分配,从而组成一个多源异构的能源互联网多源数据中心集群。

3故障区段定位

发生单相接地故障时,电源侧线路从故障点接入大地构成回路,流过接地点的电流为系统所有非故障相对地电容电流之和,当接地电阻较小时,故障点前故障相电流会显著增大,故障点后故障相电流会降低,前后出现显著差异。非故障相相电压升高,相电流微弱变化,且两个非故障相的相电流变化量近似相等。而由于配电网线路较短,故障点前与故障点后两部分各自的电流不会出现较大变化,所以故障点前和故障点后两部分各自的所有传感器所测磁场基本相同。三相电流的变化导致架空线下的磁场大小发生改变,由此可根据故障点前后磁场差异来确定故障区段。故障时刻相电流发生变化时,故障点前后的磁感应强度也同时都敏感变化。故障点前的磁场会随着相电流的增大而增大。电流的变化会影响磁场,即磁场的变化能够反映电流的变化。因此,同电流一样,磁场也能够表征线路的运行情况。

4核主成分和随机森林算法基本理论

核主成分分析主要指抽取主成分时使用非线性映射的方法,原始向量由映射函数映射到高维空间,然后再进行线性主成分分析。核主成分分析通过核技巧能够有效避免传统主成分分析中非线性变换的未确知性,所提取的主成分贡献率更加集中,核主成分分析法的优越性已在工程实践中获得广泛的认证。在配电网运行信息不全的条件下,能够获取的特征量较少,而通过核主成分分析后,可进一步挖掘特征量之间的相关性,提供更多且更高质量的特征量,从而为特征量与线损非线性映射关系的建立提供更好的基础。随机森林算法是一种集成学习的强分类预测器,其对单棵决策树的分类能力要求并不高,鲁棒性和抗干扰能力很强。随机森林算法核心原理是bootstrap重抽样法,生成的决策树是互不相关的,并独立地训练样本和投票,避免了决策树算法识别中过拟合问题的影响。随机森林算法无需独立的测试样本便可实现分类误差的无偏估计,从而有效提高了对待评估样本的预测正确率,随机森林算法在数据挖掘和故障诊断方面,其高效性和实用性的优势获得了广泛的认证。随机森林算法的各决策树的独立性能有效减少特征量与线损之间出现过拟合的问题,随机森林算法更不易陷入局部最优,能有效提高线损计算的速度。随机森林算法的高干扰性能有效应对配电网运行信息采集时存在干扰的问题,降低对特征量的要求,且随机森林算法具有更强的非线性映射能力,能使线损计算取得更高的精度。

结语

本文面向大数据环境的复杂信息融合应用,提出自组织映射神经网络的知识融合算法。该算法通过引入由实体、属性、关系组成的异构数据本体模型至自组织映射神经元的聚类及迭代竞争,有效实现了异构本体的相互关联及知识融合,同时该算法继承了自组织映射神经网络的无监督学习特点,一定程度上保障了算法的收敛性。

参考文献:

[1]韦韬,王金华.基于非分类关系提取技术的知识图谱构建[J].工业技术创新,2020,7(2):23-28.

[2]岳昆,阚伊戎,王钰杰,等.面向电子商务应用的知识图谱关联查询处理[J].计算机集成制造系统,2020,26(5):1326-1335.

*本文暂不支持打印功能

monitor