
- 收藏
- 加入书签
我国质量管理数字化文献主题研究
摘要:本研究以中国知网数据库的相关文献作为研究对象,通过Python爬虫技术全面抓取数据库中有关质量管理数字化的文献资料,在此基础上,运用Jieba库对文本进行分词和去停用词处理,构建LDA主题模型,深入挖掘国内有关质量管理数字化文献资料的核心主题,借助丝带图探究质量管理数字化主题的变化趋势。研究不仅有助于明晰质量管理数字化研究主题的发展历程,还能够对质量管理数字化未来的发展方向提供有益参考和启示,从而帮助相关学者更好地把握质量管理数字化的发展脉络。
关键词:LDA主题模型;质量管理;数字化
1 引言
质量4.0背景下,以大数据、物联网为代表的新一代信息技术正在飞速发展,有效推动了设备的自动化进程。高度自动化的设备工具、平台及工作流程系统地提升了质量管理能力,加速了质量管理理念和机制的迭代升级[1]。LDA主题模型是基于概率模型的主题模型算法,它能够无监督地处理大量文本数据[2],并计算出一个文本集合所蕴含的各类潜在主题,进而实现主题分析和文本分析。
通过梳理相关文献发现,我国关于质量管理数字化主题挖掘的研究相对较少,多数文献仅聚焦于某一领域或某个场景中质量管理数字化的应用,对于我国质量管理数字化的整体发展情况少有提及。为了更系统地挖掘国内质量管理数字化文献的研究主题,本文采用LDA主题模型对相关文献进行分析,探究各类主题的研究热点和演化特征,探寻质量管理数字化未来的发展方向。
2 文献综述
2.1 LDA主题模型
主题模型是自然语言处理中的一种常用模型,能够以无监督的学习方式从海量文档中提取主题信息,以便于后续的分析和处理。LDA是一种生成式概率模型,它在PLSA的基础上引入了狄利克雷先验分布,每篇文档都假设为多个主题的组成,每个主题又由多个词组成,先将文档集中的每篇文档的主题以概率分布的形式给出,再计算文档抽取出它们的主题分布的次数,从而进行主题聚类或文本分类。
2.2 质量管理数字化
我国质量管理数字化的相关研究较国外起步较晚,但也取得了一定成果。黄永树于2004年最早提出了质量管理数字化的初步构想,并对其内涵进行了整合。他认为质量管理数字化是现代信息技术与现代质量管理的结合,能够综合应用于产品全生命周期的各个阶段,实现信息资源的共享和质量管理的协同。随后,学者们纷纷开始尝试将信息技术、数字技术融入到质量管理中,以增强质量管理水平。
3 数据来源与预处理
在传统的文献文本分析中,一般通过关键词、摘要或全文内容进行文本分析。本文以文献摘要作为主要研究对象进行文本挖掘,提取文本主题。利用python爬取相关论文标题、摘要等内容总计563篇。本文使用Jieba库对数据进行预处理,主要包括分词和去停用词两种方法。再将处理结果进行二次筛选,获得最终数据。
4 研究过程
4.1 最优主题数确定
学者们常用来确定最优主题数的方法共有两个,分别是一致性和困惑度。本文采用困惑度来确定模型的最优主题数,通过计算得出最优主题数为14。
4.2 文本主题分析
通过LDA主题模型,从文本中提取出了信息系统、图像管理、联网监控、质量保证等14个主题。
由图2可见,自1998年起,我国有关质量管理数字化论文的总发文量总体呈上升趋势。在研究主题方面,1998-2012年的研究主题主要集中在医院管理、质量保证等方面,2012-2023年的研究主题重点在计质量检查、参数模型上。医院管理相关主题的研究持续时间较长,自1999年至今几乎每年都有相关论文发表,并于2012年到达峰值。
4.3 未来研究趋势预测
结合近年来我国颁布的有关质量管理的政策文件,以及我国质量管理数字化研究主题的变化趋势,可以发现在2012年是一个研究的分界点,之前的相关研究大多停留在对问题的探讨上,之后在于新技术与质量的结合上。综上所述,质量管理数字化未来的发展预计存在以下特点:
(1)质量管理数字化相关研究将进一步聚焦工程质量、医院管理等与民生福祉密切相关的内容。以医院管理为例,我国有关医院管理的相关研究虽然起步较早,迄今为止也产生了较多应用成果,但医院整体的服务质量水平仍需提高。如何科学的改进医院的日常管理、现场管理、药品配置等问题成为了学者们研究的重点。经研究发现,质量管理数字化能够为解决这些问题提供帮助,也造就了这一趋势的产生;
(2)质量管理数字化相关研究将与更多技术相结合。众所周知,质量管理数字化的发展离不开相关信息技术的支撑,为持续推进质量管理数字化这项系统性工程,相关企业和专业机构应坚决遵循《指南》中指出的“围绕一条主线,加快三大转变,把握四项原则”执行,提高质量和效益,推动质量变革[3]。只有这样,我们才能真正实现数字技术与质量管理的深度融合,助力我国质量管理数字化的发展;
5 结论
本文使用Python对我国质量管理数字化相关研究的论文进行爬取,使用Jieba库对文本进行分词和去停用词处理,构建LDA主题模型。经分析得到信息系统、参数模型等14个研究主题,借助丝带图展现质量管理数字化研究的主题变化趋势。从我国质量管理数字化的研究热点来看,未来质量管理数字化的发展存在以下特点:(1)质量管理数字化相关研究将进一步聚焦工程质量、医院管理等与民生福祉密切相关的内容;(2)质量管理数字化相关研究将与更多技术相结合。
参考文献
[1]刘虎沉,王鹤鸣,施华等.质量4.0:概念、基础架构及关键技术[J].科技导报,2023,41(11):6-18.
[2]郑文镇,唐锡晋.大语言模型增强下的社媒平台热榜主题分析[J/OL].2024.1.12系统科学与数学,1-18.
[3]工业和信息化部办公厅.制造业质量管理数字化实施指南(试行).[EB/OL].2021.12.31.https://www.gov.cn/zhengce/zhengceku/2022-01/11/content_5667610.htm
作者简介:曹佳玮(1999.07-)男,汉族,北京人,硕士生在读,北京信息科技大学经济管理学院,研究方向:质量管理数字化。