- 收藏
- 加入书签
基于流程自动化和NLP技术的谈心谈话内容自动录入工具研究
摘要:建设一套基于流程自动化机器人技术的谈心谈话内容自动录入工具,实现谈心谈话内容自动录入机器人,该工具模拟人员登录谈心谈话系统,将NLP智能读取的谈心谈话内容形成格式化数据,并自动录入到谈心谈话系统。流程自动化机器人依赖机器学习等认知技术,实现操作技能模仿学习,相关流程自动化可灵活应用适应新的业务模式。该工具使得基层党务工作人员免于被基础性工作占用大量时间精力,节约人力成本同时,降低工作强度,提高数据录入准确性和党建工作效率。
关键词:流程自动化、谈心谈话录入、NLP读取
1 引言
为深入践行党的群众路线,落实关于新时代加强和改进思想政治工作的部署安排,坚持以习近平新时代中国特色社会主义思想为指导,充分发挥党密切联系群众的独特优势,持续巩固“我为群众办实事”实践活动成果,密切党群干群关系、传递组织关心、倾听员工诉求、了解员工心声、解决员工困难,不断增强广大员工的获得感、幸福感、安全感。按照公司党委践行党的群众路线开展全覆盖员工谈心谈话工作方案的要求,结合企业实际,需要每年对员工开展一次全覆盖谈心谈话。以某地市级企业为例,目前开展一次谈心谈话工作的谈话人数约四千人左右。根据谈心谈话工作方案要求,每年每人、每次的谈心谈话内容均要录入关心关爱“一对一”谈心谈话系统,每年录入谈心谈话系统的记录数将达四千余次,而每条记录需要填入10余项信息,且均为简单重复操作。
因此,可开发一套谈心谈话内容自动录入工具。通过模拟人员登录谈心谈话系统,实现将对员工关心关爱“一对一”谈心谈话内容自动化录入谈心谈话系统对应模块,将基层党务工作人员从机械录入工作中解放出来的同时,确保数据录入准确性,并提升党建工作效率。
2 系统架构
2.1流程自动化机器人
[1]流程自动化机器人是一种模拟人类处理各种业务流程的软件系统,它利用视觉识别和自然语言处理等技术,能够在符合规则的情况下自动执行一系列操作。流程自动化机器人可以处理大量数据,减少内部错误率,并且在操作过程中保持准确性和一致性,帮助企业节省时间和成本,提高效率。流程自动化机器人可以替代人工自动从业务系统中获取数据,并存储在数据库中,以便后续处理与分析,如进行数据清洗、过滤和转换等操作,确保最终数据的准确性和可靠性。流程自动化机器人可以自动处理客户的请求和问题,如自动回答客户问题、提供产品咨询服务等,通过机器人的处理,客户可以获得快速解答和支持,提高客户满意度和忠诚度。流程自动化机器人可以自动化执行一系列的业务流程,机器人可以按照预设的流程节点执行任务,并在执行过程中对流程进行监控,生成报告和提醒,以便及时发现异常,确保业务流程的顺利进行。早期依赖于人为干预与反复调试的流程机器人编程方式只适用于特定任务,当遇到相近任务或不同环境时,需要重新进行编程,从而无法汲取过往的操作经验,存在效率低、适应性差、灵巧性不足等问题。而随着人工智能技术的发展,[2]流程自动化机器人已具备一定的自主决策和学习能力,进而使机器人能够学习到适应于不同任务和环境的操作技能,避免对每个任务的繁琐编程,并最终实现其流程自动化的目标,该项技术能够加快软件产品的上市速度,降低成本并释放员工能力,正成为企业数字化转型的重要途径。2018年中国工程院院刊明确指出,新一代智能机器人机理是人-信息-物理系统,其典型特征是人将部分认知转移给信息系统,使系统具有认知与学习能力。在人-信息-物理系统中将人的操作经验与灵巧性迁移到机器人系统,使其获得高度类人化操作能力,是机器人操作技能学习的一种重要方式。根据该类机器人操作技能学习方法的特点以及实现过程,我们将其表述为机器人操作技能的高效率模仿学习。实际应用中的实现过程包括三个阶段:
第一阶段是人类对机器人进行示教阶段。一般让熟练的人员根据自身操作经验通过拖动示教、远程示教或虚拟示教等方式对机器人系统进行示教,在示教过程中机器人跟随示教者进行动作,并同步采集机器人、操作对象、以及环境状态信息等。
第二阶段是机器人操作技能的建模与学习阶段。主要通过人工智能技术,如采用人工智能算法对经验数据进行封装形成技能模型方式等,从经验数据中获得机器人的动作策略,最终实现机器人操作技能学习,通过技能学习可以获得技能模型的参数。
第三阶段是机器人操作技能的实例化与泛化应用阶段。当面临相近的操作任务应用需求时,通过智能感知技术对新任务的目标进行识别与定位,将学习到的技能模型适应于环境变化,并根据任务需求选择合适的机器人控制模式。机器人高效地对所习得的操作技能进行泛化处理,可以生成新的操作技能来完成新的任务,从而极大增加了机器人系统的效率及灵活性。
本课题中,通过操作技能模仿学习,流程自动化机器人实现谈心谈话内容自动录入流程变更的可配置性。在谈心谈话业务调整时,只要对新的任务目标进行定位,让机器人模仿学习新的操作技能,形成新的业务技能模型,并生成新的机器人运行控制脚本,就能自适应业务变更。流程自动化机器人应用AI技术实现信息的数字化输入,在谈心谈话内容自动录入场景中,需要用到自然语言处理(Natural Language Processing,NLP)技术,从非结构化的谈心谈话内容文本中抽取信息形成格式化录入数据,自动录入到谈心谈话系统。[3]自然语言处理是以语言为对象,利用计算机技术来分析、理解和处理自然语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。包括自然语言理解(NLU)和自然语言生成(NLG)两部分。自然语言处理的基本任务是基于本体词典、词频统计、上下文语义分析等方式对待处理语料进行分词,形成以最小词性为单位,且富含语义的词项单元。
2.2 基于流程自动化机器人的谈心谈话内容自动录入流程
基于流程自动化机器人的谈心谈话内容自动录入流程如下:
(1) 谈心谈话内容自动录入机器人
基层党务工作人员根据谈心谈话工作方案要求,每年均要开展一次全覆盖谈心谈话工作,谈心谈话内容自动录入工具通过运行自动录入机器人脚本,让谈心谈话内容自动录入机器人智能读取谈心谈话记录表格数据内容,并按照一定规则进行NLP处理后,形成格式化录入数据,然后启动系统登录状态保持机器人登录谈心谈话系统,模拟人员将相关业务数据录入谈心谈话系统,录入完成后点击提交按钮进行数据保存,并开始新一条谈心谈话内容的数据录入工作。
NLP任务中,首先需要对谈心谈话内容进行文本分类,文本数据不同于数字,图像或信号数据,它要求NLP具有能够进行精细化处理的能力,[4]文本分类就是从原始文本语料中提取语义特征,并基于这些特征预测文本数据的主题类别。目前文本分类方法包括基于浅层学习模型的文本分类和基于深度学习模型的文本分类两钟。在对输入模型的文本数据进行预处理这一步时,浅层学习模型先通过人工标注方法来获得良好的样本特征,然后使用经典的机器学习算法对其进行分类,该方法的有效性在很大程度上受限制于特征提取结果的好坏。与浅层模型不同的是,深度学习通过学习一系列的非线性变换模式将特征工程直接映射到输出,从而将特征工程集成到模型拟合过程中。本课题中采用基于浅层学习模型的文本分类方法。
浅层学习模型具有较快的文本分类速度,为提高准确性,首先需要对原始输入文本进行预处理,以训练浅层学习模型,该模型通常包括分词,数据清理和数据统计。然后文本表示旨在以对计算机来说更容易的形式来表达预处理的文本,并最大程度地减少信息丢失,例如词袋(BOW)、N-gram、术语频率倒排文档频率(TFIDF)、word2vec 和 GloVe。BOW的核心是用字典大小的向量表示每个文本。向量的单个值表示对应于其在文本中固有位置的词频。与 BOW 相比,N-gram考虑相邻单词的信息,并通过考虑相邻单词来构建字典。TF-IDF使用单词频率并反转文档频率来对文本建模。word2vec使用本地上下文信息来获取单词向量。GloVe具有局部上下文和全局统计功能-训练单词-单词共现矩阵中的非零元素。最后,根据所选特征将表示的谈心谈话内容输入分类模型。浅层学习方法是机器学习的一种。它从数据中学习,在训练分类模型之前,我们需要收集知识或经验以从原始文本中提取特征。浅层学习方法基于从原始文本中提取的各种文本特征来训练初始分类模型。对于小型数据集,在计算复杂度的限制下,浅层学习模型通常比深层学习模型表现出更好的性能。文本分类主要是通过学习各种语义知识来推断特征,多标签文本分类则需要充分考虑标签之间的语义关系。
目前文本特征提取算法包括基于词频的算法和基于词向量的算法两种。基于词频的特征提取算法就是将文本中每个词出现的频率作为该词的特征值,然后建立一个文本特征向量,以此来进行分类。基于词向量的特征提取算法则是将文本中的词转化成向量,然后将这些向量作为特征表示文本,最后进行分类。目前常用的基于词向量的特征提取算法是词嵌入技术,即将文本中的每个词语映射到一个高维空间中,使得每个词语可以用一个向量表示。这些向量具有相似的语义和语法含义。最后将这些向量作为特征向量进行分类。通过这种方式,可以比基于词频的特征提取方法更好地表达文本中的词汇之间的语义关系。在处理文本分类中的重要名称、组织、术语等专有名词时,基于词向量的方法更具优势。谈心谈话内容经过文本分类处理后,按照分类标签从中抽取信息形成格式化录入数据,自动录入到谈心谈话系统。
(2) 系统登录状态保持机器人
谈心谈话内容一次录入多条记录,且每条记录按照一定规则进行NLP处理,形成格式化数据后才录入系统,每次自动化录入时间较长,因此需要谈心谈话内容自动录入工具通过运行状态保持机器人脚本,让系统登录状态保持机器人模拟人员登录谈心谈话系统,并打开相关业务模块的工作页面。如果登录状态为退出情况时,则由系统登录状态保持机器人重新登录谈心谈话系统,以便录入相关数据。
(3)工具运行监控
谈心谈话内容自动录入工具每日定时运行,运行结束后提示运行结果。谈心谈话业务调整时,工具中机器人系统对新的任务目标进行智能感知和重新学习,形成新的业务技能,生成新的机器人运行脚本,就能适应新的业务需求。
3 应用效果
谈心谈话内容自动录入工具,通过流程自动化机器人模拟人员登录谈心谈话系统,将读取的谈心谈话记录,通过NLP处理后形成格式化数据,模拟人员录入到谈心谈话系统。流程自动化的作用是代替人工在用户界面完成高重复、标准化、规则明确、大批量的日常事务操作,该工具的使用使得基层党务工作人员免于被基础性工作占用大量时间精力,在节约人力成本的同时,提高数据录入准确性,提高工作效率。流程自动化机器人支持人机交互合作模式,其依赖机器学习等认知技术就可实现业务自动化中的灵活应用,不受制于底层IT架构。在党建谈心谈话业务变更时,只需重新学习后生成新的机器人运行脚本,就能适应新的业务管理模式。流程自动化机器人可以替代在此之前认为只有人类才能完成的工作,在降低谈心谈话内容录入系统时间的同时提高党建工作效率。
4结论
谈心谈话内容自动录入工具,通过流程自动化机器人和NLP技术智能读取谈心谈话记录表格,形成格式化的数据内容,并模拟人员登录谈心谈话系统,将相关内容录入到谈心谈话系统。流程自动化机器人依赖机器学习等认知技术可实现业务自动化中的灵活应用,该工具使得基层党务工作人员免于被基础性工作占用大量时间精力,在节约人力成本同时,降低工作强度。工具减少谈心谈话内容录入系统的时间,提高数据录入准确性和党建工作效率。
参考文献
[1]熊强.机器人流程自动化技术在信息系统中的应用研究[J].中国新通信, 2021, 23(20):2.
[2]向国菲.不确定环境下机器人的自主任务学习及抗扰策略研究[J].[2023-10-19].
[3]张亚非,范建华.自然语言处理:方法与技术[J].计算机应用与软件, 1998, 15(6):16.DOI:CNKI:SUN:JYRJ.0.1998-06-000.
[4]魏伟.基于条件共现度的文本表示与特征抽取方法研究[D].大连理工大学,2018.DOI:CNKI:CDMD:1.1018.138154.
作者简介:
杨帆帆,女,贵阳供电局三级拔尖技术专家,高级工程师,贵州电网有限责任公司贵阳供电局,贵州贵阳,550001,研究方向:数字化技术、网络安全技术。
魏雪齐,女,工程硕士,数字化从业15年,贵阳供电局三级拔尖技术专家,高级工程师,高级技师,贵州电网有限责任公司贵阳供电局,贵州贵阳,550001,研究方向:数字化技术、网络安全技术。
周洋,女,工程硕士,网络安全专责,贵阳供电局一级拔尖技术专家,高级工程师,贵州电网有限责任公司贵阳供电局,贵州贵阳,550001,研究方向:数字化技术、网络安全技术。
李婧源,女,大学学士,数字化从业14年,贵阳供电局优秀专业技术专家,工程师,技师,贵州电网有限责任公司贵阳供电局,贵州贵阳,550001,研究方向:数字化技术


京公网安备 11011302003690号