- 收藏
- 加入书签
基于卷积神经网络的气象信息微博传播特征提取方法
摘要:由于信息的传播受多种因素影响,导致对其的传播特征提取结果误差较大,为此,本文提出基于卷积神经网络的气象信息微博传播特征提取方法。将气象信息作为微博空间内的粒子,并将其状态分为初始状态、预测阶段、校正阶段、重采样和滤波阶段,在状态分析中引入环境影响因子和观测影响因子,通过差异化赋权去除非常态传播对其的影响,利用卷积神经网络提取粒子化后的信息传播特征。测试结果表明,设计方法对于气象信息微博传播特征提取误差不超过0.1%。
关键词:卷积神经网络;气象信息微博;传播特征;环境影响因子;观测影响因子;粒子化;
中图分类号:TP391.4 文献标识码:A
0引言
气象信息的发布主要目的是服务于大众,而为人们提供准确可靠的气象信息不仅需要准确的气象数据信息,同时也需要结合信息的传播规律和特征,提高信息传播定位的精准程度[1]。实现这一目标的前提是要对信息传播的特征有准确的把握[2]。微博作为互联网时代重要的信息交互工具,不仅成为了气象信息传播的重要途径[3],同时其表现出的传播特征也为气象信息在更大范围内的获取提供了重要指导价值[4]。
为此,本文提出基于卷积神经网络的气象信息微博传播特征提取方法,并通过试验测试验证了设计方法的有效性。通过本文的研究,以期为相关气象信息发布机构及单位提供有价值的参考,使得信息的发布实现更大价值。
1基于卷积神经网络的气象信息微博传播特征提取
1.1信息粒子化处理
微博作为一个庞大的网络空间环境,其中的任意一条信息都可以看作是空间中的一个粒子,对气象信息在微博中传播特征的提取可以转化为对信息粒子在该空间的分布,为此,本文首先将气象信息粒子化处理。由于信息经传播后在微博系统的分布以非线性的状态存在的,因此,本文将信息粒子的状态分为初始状态、预测阶段、校正阶段、重采样和滤波阶段。以此为基础,假设粒子在任意时刻的状态为
其中,t表示信息粒子存在的时间,x表示信息粒子的状态,f(*)表示观测方程,h(t)表示t时刻x信息粒子状态中的环境影响因子,e(t)表示t时刻x信息粒子状态中的观测影响因子。
以此为基础,就可以通过式(1)对不同阶段的粒子状态进行定义。其中,初始状态即t无限趋近于0的时刻,并且存在h(t)=0,且e(t)=0,此时的粒子在微博网络空间内的分布是以单个中心的形式存在的。当t的值逐渐增加,信息粒子被复制和传播,其存在的形式更加离散化,状态更多地受到h(t)和e(t)的影响,并且二者的强度越大,信息的传播范围越广,传播速度越快。预测阶段则是以当前t时刻信息粒子的状态对t+1时刻的状态发展进行分析,其是由经过传播后处于分散状态的所有信息粒子共同决定的,计算方式为
其中,x(t+1)表示预测时刻的信息粒子状态,n表示经过传播后信息粒子的数量,hi(t)和ei(t)分别表示i信息粒子所处的位置的环境影响因子和观测影响因子。
按照预测结果,对传播后的粒子状态重新进行采样,并与预测结果进行对比,当二者出现差异时,则表明信息粒子在传播过程中出现了非常态的传播机制,此时,需要对粒子进行滤波操作,去除该部分数据对特征提取结果的影响。本文通过对粒子进行差异化赋权实现该过程,其计算方式为
其中,wi表示赋权结果,λ表示权重系数。
通过这样的方式,完成对气象信息的粒子化处理。
1.2基于卷积神经网络的特征提取
在上述基础上,对于气象信息微博传播特征就可以转化为信息粒子在微博网络空间中的行动轨迹。为此,本文构建了5层的卷积神经网络,其构成如图1所示。
首先,通过输入层将初始状态的信息粒子输入到卷积神经网络中,在卷积层1获取大量传播后粒子的状态信息,应用卷积网络模型对该部分数据进行训练,将训练后的结果对输入到采样层,形成与实际粒子状态信息特征的映射关系,其计算方式为
其中,pi表示粒子状态信息的特征值。
以此为基础,并按照不同的分组进行差异化的偏置和权值复核操作,完成该操作后,将该结果作为激活下一层卷积函数的基础数据,对采样层的特征映射结果进行滤波,此时的特征值即为卷积神经网络的输出值,也就是气象信息微博的传播特征提取结果。
2试验测试
2.1测试环境设置
本文以微博上的某气象信息发布博主在过去发布的某一特大暴雪气象信息为测试目标,计算其在微博中的传播特征。已知该博主的粉丝数量为12.6万人,微博消息日均互动为2.3万,单日发布信息数量为2-4篇,单篇微博的平均阅读量为7.8万,其中,转发、评论以及点赞的人数比例为2:3:5。本文以某日其发布暴雪气象信息微博后的24小时内的信息传播发展趋势为测试目标,并与实际的微博数据信息进行对比,分析本文设计方法的性能。
2.2测试结果
在上述基础上,采用本文方法对气象信息的传播特征进行分析,其具体情况如表1所示。
从表1中可以看出本文方法提取结果中,在微博信息发布后的3小时迎来信息传播的爆发期,并持续6小时,之后逐渐步入传播衰退期,在微博发布后的16小时,基本不再具有明显的传播属性。
在此基础上,通过与实际传播数据进行对比,得出的差异结果如图2所示。
从图2中可以看出,本文的特征提取结果与实际传播特征之间的差异始终稳定在0.1%以内,在气象信息发布的初期,误差相对较大,这主要是因为对于信息本身对传播结果具有一定影响,与常态化气象信息相比,其价值更高。
3结束语
信息的传播特征为相关信息的发布提供的指导,气象信息作为与人们生活密切相关的信息内容,如何提高其传播效果更是值得关注的问题之一。本文以微博为研究环境,利用卷积神经网络对气象信息的传播特征进行分析和研究,实现对其传播发展态势的准确计算。通过本文的研究,以期为气象信息相关发布组织提供有价值的参考。
参考文献:
[1]魏超, 赵志岗, 焦晓峰, 等. 基于卷积神经网络的短期天气预测研究[J]. 仪器仪表用户, 2021, 28(01): 85-89+84.
[2]章胤, 耿燕, 李佳霖, 等. 基于卷积神经网络与改进协同过滤算法的电视产品推荐研究[J]. 长春师范大学学报, 2021, 40(02):77-81.
[3]梁超, 刘永前, 周家慷, 等. 基于卷积循环神经网络的风电场内多点位风速预测方法[J]. 电网技术, 2021, 45(02): 534-542.
[4]蒋雨肖, 丁晟春, 吴鹏. 基于BiLSTM-VGG16的多模态信息特征分类研究[J]. 情报理论与实践, 2021, 44(11): 180-186+179.







京公网安备 11011302003690号