- 收藏
- 加入书签
基于改进深度学习的变电站机器人巡检路径规划研究
摘要:随着我国智能电网的不断发展,对电网的运行可靠性的要求也逐步提升,变电站作为电网的重要组成部分,保障变电站内设备的稳定运行至关重要。目前,传统变电站的设备巡检通常以工作人员现场巡检,手动记录方式为主,但是考虑到变电站设备种类繁多,仅依靠人工方式存在人员工作负担重,处理效率低,巡检结果有错误等问题。因此,巡检机器人逐步代替人工成为变电站智能巡检的发展方向。
关键词:深度学习;变电站机器人;巡检路径;
引言
变电站巡检机器人作为获取信息和运行的重要手段,正在逐步转向变电站巡检行业的各种应用,以执行更加复杂多样的巡检任务。根据变电站巡检机器人的不同运行方式,有针对性的巡检道路规划将有效提高巡检机器人的运行效率,有助于操作人员快速掌握设备的运行情况。
1深度强化学习网络
深度强化学习网络是将深度学习与强化学习相结合,利用深度学习在高维信息上的理解能力和强化学习在复杂环境处理上的决策能力,从而解决现实生活中的复杂问题。其基本思想是根据智能体观察到的环境和自身状态,通过迭代学习进行动作已达到其目标,在t时刻,根据智能体通过对当前时刻环境的感知,得到当前状态st,并执行策略ε采取此次动作at,即at=π(st)。每次智能体与当前环境交互后会得到一个奖励rt,从而进入下一个循环过程。其中需要对未来得到的奖励进行折扣计算,即式中:γ为折扣因子,取值范围为[0,1]。强化学习网络中状态动作函数Qπ(s,a)为在状态s下执行策略π执行动作a得到的累计奖励。当智能体接收到所有状态动作后,执行策略π*得到奖励为最高时,则策略π*为最优策略,即满足贝尔曼方程,即其中对于任意有限的动作和状态,贝尔曼最优方程都有唯一解,因此对式子进行求解,即。
2变电站机器人组成结构
变电站自动检测机器人具有自主导航、精确定位、自动加载、可见光和声音集成等特点。无线射频识别标签设置在专用道路上,使机器人能够双向行走和规划最佳路线,同时通过无线网络将检测到的设备的声音、视频和温度传输到监控室。机器人检查完毕后,后台可通过与变电站智能控制操作系统协调,获取变电站外观异常确定、设备热缺陷和仪表读数的数据,实现变电站的自动化维护。巡检机器人系统分为基站系统、移动站系统、通信系统和终端系统四个层次。基站层主要负责接收和处理漫游控制系统的数据。它也是管理人员了解机器人实际状态和运行状况的直接渠道。它由数据库、模型配置、数据处理、状态警报、设备界面、视图显示等模块组成。移动站层主要负责检查工作中机器人的运动行为整体规划主要是求解两个目标步骤之间的最短目标点到达顺序,以求解合格路径和求解整体路径。局部规划以整体规划结果为基础,结合了射频识别(RFID)标签、激光雷达传感器等检测信息。规划机器人的局部移动行为,包括直线跟踪、方向、避障、运动速度调节、停车等。随后,根据变电站的实际工作条件对机器人主体进行建模,将收到的运动指令分解为机器人的各个马达,计算每个马达必须支持的速度,每个马达由多轴运动控制器控制,从而实现检查机器人的自主运动。主程序软件设计流程从机工作步骤如下:首先,使系统进入延时开机状态,使之初始化阶段,而后不断完成每个电路模板的自检工作;其次,结束自检作业后,利用控制模数转换器(ADC0)对电压信号进行A/D转换;最后,结束转换作业后,利用单片机对数据进行分析处理,在利用LCD液晶展示处理后得到的电场值同时,将其传输至主机当中,假如发现电场出现过限问题,那么从机便会马上发出警报,并将该问题上传至主机。主机主要负责信号的接收工作,对从机传输的电场数据进行双重监控,具体工作步骤如下:①使系统进入延时开机状态,并初始化;②将查询从机地址信号传递到从机当中,由从机进行应答;③当地址核查无误后,主机展示从机的电场值,反之则命令从机再次发送数据进行二次核对,当主机检测到从机发送的数据存在过限问题时,则会立刻报警。
3巡检路线规划
3.1协助应急处理
在机器人检查模式下,当变电站设备状态发生变化时,无监控,或者在获得系统报警信息后,操作人员可以呼叫后台检查机器人,快速到达指定的设备范围,及时检查设备状态,检查报警信息;发生无人值守变换站事故时,操作人员可命令后台机器人进入事故现场,快速定位故障区,实时读取现场数据。规划检查路线时,环境电子地图的中心点是坐标原点,建立了主笛卡尔坐标系,辅助笛卡尔坐标系的原点由地图上的检查机器人起点和终点、地图坐标系确定。
3.2改进深度强化学习网络
考虑变电站巡检机器人作业中采集到的信息量维数高,在神经网络进行连续迭代学习过程中,Q值收敛时间过长,导致训练效率低。因此通常利用卷积神经网络作为非线性函数对Q函数进行预估。对卷积神经网络的结构进行优化,并结合人工势场法重新设计深度强化学习网络的奖励函数,以此加快算法收敛速度,提升图像处理速度。为了提升深度强化学习的训练速度,解决动作选择盲目问题,结合人工势场法进行前期训练。当神经网络选定动作空间后,利用人工势场法计算巡检机器人下一时刻位置S′,通过更新环境得到巡检机器人实际位置S,对两者距离作差并乘以距离系数得到等效距离差,乘以人工势场法的权重系数加到原有的奖励函数上。在训练过程中,前期人工势场法权重较大,能够加快训练速度,随着训练次数增长,权重系数逐渐减小。
3.3全站全巡
站进给机器人利用可见光相机、红外传感器和全稳态红外温度进行例行的变换循环。以下要求适用于国营电力公司的检查周期:至少每两天一次,至少每三天一次,每周至少一次。为了提高检查机器人的效率,运输部门人员必须规划机器人的巡逻路线。绘制变压器高速公路检验的地形图,从而简化拆除过程。连接图中分配给每个节点的页数称为度,奇数节点称为奇点,偶数节点称为直线点。如果奇点数为0,则机器人检查过程可能是“笔划”。否则,必须对奇点进行配对才能生成Euler图。使用枚举或奇偶校验方法优化奇点对,以减少重复机器人的距离。检查每个节点均为直线的道路拓扑时,使用Fleury算法规划工作站访问者的整个环形道路。Fleury算法的基本思想是,边缘依次绘制,除非没有其他选择,否则在绘制的每一步都不会返回,而是单个木桥。
结束语
针对变电站巡检机器人路径规划问题,本文提出了一种基于改进深度强化学习的路径规划方法。通过对传统卷积神经网络结构进行优化,进行归一化处理,加入经验回访机制,提升深度强化学习的收敛速度,减小深度强化学习网络训练量,结合人工势场法解决动作状态盲目选择问题,提升算法的稳定性。
参考文献
[1]李冠华,徐凯,董雪晴,荆澜涛,王亮,宋伟,崔巨勇.变电站接地阻抗降阻措施评估方法[J].沈阳工业大学学报,2022,44(01):14-19.
[2]邵洪平,徐一蓉.变电站接地网工程降阻技术研究[J].电力设备管理,2020(03):46-47+64.
[3]邱相庭.变电站接地系统降阻及优化的研究[J].科技创新导报,2018,15(27):52-53.
[4]王如飞.应如何选择变电站接地网降阻措施的探讨[J].科技风,2017(22):176.
[5]徐水英.110kV变电站接地电阻的降低及核算分析[J].通讯世界,2015(22):124-125.

京公网安备 11011302003690号