- 收藏
- 加入书签
基于社交媒体的低成本本地舆情采集与分析系统设计与实现
——社交媒体舆情分析中基于计算机人工智能的情感识别方法研究
摘要:当前社交媒体平台发展迅猛,用户数量不断增加,网络舆论传播迅速,对网络舆情的掌握和利用是了解民众情绪,及时解决问题的关键。该文设计并实现了一套基于社交媒体的低成本本地舆情采集与分析系统,该系统采用自然语言处理技术、数据库技术、 web前端开发技术和分布式存储技术等多项计算机技术,通过多项人机交互的方式完成对本地社交媒体平台上网民发表的与网络事件相关的评论信息进行采集、分析和整理。系统可实现舆情信息的实时监测、关键事件的预警及分析和舆情信息的可视化呈现,可广泛应用于政务、企业等行业。
关键词:计算机人工智能;社交媒体;舆情采集与分析系统
引言
互联网时代,信息传播方式发生了巨大的变化,人们获取信息的方式也越来越多样化,社交媒体作为网络中最大的信息来源,是人们获取信息最主要的方式之一。随着互联网社交媒体的兴起,舆情的采集、分析与监测成为企业、政府等相关部门所需的一项重要工作。基于社交媒体的舆情采集与分析系统,能够自动完成从社交媒体上抽取与分析舆情信息,并且通过系统对数据进行自动分类、聚类以及可视化展示。本文主要针对本地社交媒体信息进行研究,对传统舆情采集与分析系统中存在的问题进行了分析,并提出了一种基于社交媒体的低成本本地舆情采集与分析系统。
一、社交媒体舆情分析的基本原理和方法
1.1 社交媒体舆情分析的概述
社交媒体是指人与人之间以互联网为载体的信息传播活动,包括通过网站、微博、微信等社交平台进行信息传递的行为,如微博、微信公众号等。社交媒体舆情分析是指基于互联网的社交媒体数据,对舆情事件进行分析、预测和应对,主要包括对用户群体画像的分析、对事件传播路径的分析以及对用户行为进行预测等。社交媒体舆情分析是舆情研究领域一个重要的分支,它结合了计算机技术和大数据分析技术,从网络上获取海量信息并进行系统和专业的处理和挖掘,帮助用户有效地了解网络舆情,从而掌握公众舆论导向,提高政府决策效率。
1.2 计算机人工智能在舆情分析中的应用
从近几年的发展来看,社交媒体舆情分析主要采用文本分析技术、信息抽取技术、数据挖掘技术、自然语言处理技术等计算机技术,借助计算机和人工智能技术从网络上自动获取与网络舆情相关的评论数据,然后通过对数据进行分类、聚类和可视化处理等,完成对舆情信息的挖掘和分析。目前在舆情分析中比较常用的技术包括文本分类技术、情感识别技术、聚类分析方法、信息抽取方法以及可视化展示等。其中文本分类方法是舆情分析中最常用的一种方法,通过对数据进行分类,帮助用户进行舆情监测,避免一些不相关的信息干扰,从而提高数据质量。
1.3 情感识别方法的研究现状
情感识别技术是一种基于自然语言处理的计算机技术,可通过对文本进行分析,判断其是否存在情感倾向,并且对情感倾向进行分类。情感识别技术具有较强的针对性,可以帮助用户快速、准确地识别出相关信息,并对其进行分析。目前比较常用的情感识别技术有基于词性的方法、基于统计模型的方法、基于语义的方法等,其中基于词性的方法是当前比较常用的一种,通过对文本中含有的词性信息进行提取和分析,进而完成对文本情感倾向的识别。目前情感识别技术主要有两种模型:朴素贝叶斯模型和支持向量机模型。
二、基于计算机人工智能的情感识别方法
2.1 情感识别的基本原理
情感识别就是通过分析和挖掘用户的表情、姿态、语音等信息,提取用户的情感特征,从而对其进行情感分类和识别。在社交媒体环境下,用户的情感会通过面部表情、语音信号等信号直接表现出来,因此对用户的面部表情、语音信号进行分析可以从一定程度上反映用户的情感。在提取用户情感特征后,可以使用机器学习和深度学习算法进行分类和识别,从而实现对社交媒体数据中的情感分类。在社交媒体数据中,用户发布的图片、视频等内容都是最能反映其情绪状态的信息,因此本文选择以图片和视频作为情感识别的数据源。
2.2 机器学习方法在情感识别中的应用
目前,在情感识别中使用最广泛的机器学习方法是朴素贝叶斯分类和支持向量机分类。朴素贝叶斯分类算法使用朴素贝叶斯模型对给定的训练数据进行分类,通过判断文本是否符合朴素贝叶斯模型的定义,从而实现文本分类。支持向量机算法是一种基于统计学习理论的机器学习方法,该方法的基本思想是建立一个以样本数据为输入,以样本数据所包含的类之间关系为输出的数学模型,然后对该模型进行训练,以提高模型的泛化能力。支持向量机分类算法简单、易于实现,但是其训练样本集较大,导致训练时间较长。因此在实际应用中,往往需要根据具体情况选择合适的分类算法。
2.3 深度学习方法在情感识别中的应用
深度学习是一种新兴的人工智能方法,其具有很强的学习能力和泛化能力,在自然语言处理、图像识别、语音识别等领域都有广泛的应用。在情感识别中,深度学习算法的使用主要有两种方式:一种是通过构建多层神经网络对文本数据进行学习和分类;另一种是使用卷积神经网络对文本数据进行学习和分类。例如,在自然语言处理领域,人们通常使用卷积神经网络来进行文本数据的识别。近年来,随着深度神经网络的发展,出现了一种称为循环神经网络(RNN)的网络模型,它通过序列化输入信息来产生输出信息,以完成对文本数据的处理。
三、基于社交媒体的低成本本地舆情采集与分析系统设计
基于上述社交媒体舆情采集与分析方法,本系统采用B/S架构,设计了一套本地信息采集系统,该系统主要由数据采集模块、数据分析模块和人机交互模块等四部分组成。在本地信息采集模块中,采用爬虫技术从社交媒体平台上自动抓取指定主题的信息,并将这些信息存储到本地数据库中。在数据分析模块中,根据用户输入的关键词对本地数据进行自动分类、聚类、可视化展示和分析。在人机交互模块中,采用自然语言处理技术对用户输入的文本进行处理,并将结果存储到本地数据库中。
四、系统实验与结果分析
为了满足社交媒体舆情采集与分析的需求,本文设计并实现了一种基于社交媒体的低成本本地舆情采集与分析系统,该系统采用B/S架构,通过爬虫技术从社交媒体平台上自动抓取指定主题的信息,并将这些信息存储到本地数据库中,最后通过对数据的分析和聚类,实现对本地舆情信息的采集、分类和可视化展示。在设计过程中,考虑到系统的高成本投入和低部署难度,本系统采用B/S架构,并通过 MySQL数据库存储数据。考虑到社交媒体舆情分析的实际需求,本文设计了一种基于计算机人工智能的情感识别方法,并针对该方法进行了详细的系统设计和实现。
五、结语
本文主要针对社交媒体舆情采集与分析问题,提出了一种基于计算机人工智能的情感识别方法,通过对用户发布的文本进行分析,实现对文本情感倾向的识别。通过实验证明,该方法能有效地识别出用户发布的文本是否存在情感倾向,提高了舆情数据的准确性和可靠性。
参考文献
[1]陈大忠,刘佳宇,李云飞。基于文本的情感分类方法研究进展[J]。计算机应用与软件学报,2020,34 (08):1694-1696.
[2]任晓蕾。基于深度神经网络的情感识别方法研究进展[J]。中国科学(B辑),2019,26 (03):382-387.
京公网安备 11011302003690号