• 收藏
  • 加入书签
添加成功
收藏成功
分享

大数据治理背景下机关档案数据治理路径研究与实现

曾婷 危娅婷 王恒
  
卷宗
2020年22期

打开文本图片集

摘 要:政府机关档案是社会治理、城市管理的重要数据来源,呈现出体量大、多源、异构、复杂等特点,同时也存在数据冗余重复、数据质量良莠不齐、数据标准不一等问题。本文从机关档案数据的内涵、类型与特点出发,揭示档案数据治理在机关档案数据管理与服务中的必要性,设计机关档案数据治理步骤,并根据工作实际建立具备可实施性的数据治理实现路径与方法。

关键词:机关档案;档案数据;数据治理

大数据环境下,信息技术与经济社会的交汇融合引发了大数据迅猛增长,数据已成为国家基础性战略资源[1]。“数据”已成为国家治理、社会治理中不可或缺的因素,数据管理部门应积极探索数据治理之道,提升数据管理能力,充分发挥数据资产的价值,有效支撑社会治理与实践变革。近年来,随着档案事业的推动与发展,各级各类档案机构档案数据快速增长,汇聚了大量的电子文件、照片、录音、录像等数据资源,档案数据呈现出体量大、类型丰富、载体多样、结构复杂等特点。截止2017年底,全国档案数字化资源达2243万GB[2]。档案作为管理、文化与智力活动的可靠证据和社会演变的反映的唯一性,是负责、透明的国家和社会管理行为的治理基础[3]。大量的非结构化、异构性、多源性数据给传统的档案数据管理方式带来了极大的挑战,为充分发挥机关档案在数字政府建设与社会治理活动中的作用,如何开展档案数据治理,实现高质生产、高效管理、深度开发、高度共享成为当前机关档案数据管理的重要课题。

1 机关档案数据概述

1.1 机关档案数据内涵

档案数据是指在档案管理过程中产档案数字副本、原生电子文件、元数据、网页数据、用户数据、应用数据、系统数据等各种类型数据,是记录档案数据产生与收集、处理与分析、存储与传输、开放与利用、销毁与处置等全生命周期的档案数据集。机关档案数据是机关在公务活动中形成的,对国家和社会有查考、利用和保存价值的各种形式、格式载体的历史记录的数字形态数据[4],又包含了办公自动化系统、业务系统产生的归档电子文件及其元数,还包含了档案管理系统中产生的操作日志、组织与用户、档案利用、数据统计、数据存储、系统运行等数据。

1.2 机关档案数据来源及类型

机关档案数据主要来源于两个方面:一是业务部门通过行政审批业务系统办理业务事项产生的业务电子文件及其元数据;二是档案部门通过档案系统进行著录、编目、数字化、编研、统计、鉴定、维护等行为产生的数字模拟档案数据与业务活动数据。

根据数据内容,机关档案数据可大致划分为文件型、信息型两大类。其中,文件型包含原生电子文件、档案数字副本、网页等文件级数据;信息型包含元数据、用户数据、统计数据、编研成果、操作日志、利用登记、在线利用等信息级数据。根据数据格式,机关档案数据可大致划分为PDF、Word、Excel、JPEG、TIFF、XML、WAV、MPEG等类型数据。

1.3 机关档案数据特点

机关档案数据具有量大、多源、异构、复杂等特点。随着全国范围内数字档案馆及数字档案室建设,档案数字化资源量急剧增长,数据体量不断增大;档案单轨制工作探索与推进,电子文件与电子档案数量不断增加,档案数据结构差异化明显,数据格式各异,档案数据体量与复杂性不断增加。

机关档案数据具有周期性、动态性和关联性。机关档案主要由公文办理与行政审批等业务活动产生,形成的档案数据在时序上具有鲜明的周期性特点,同时需要根据办理项目生命周期对档案进行动态的跟踪管理,确保档案之间的关联性,为后续查询利用、管理决策奠定基础。

机关档案数据具有证据性、凭证性。各政府机关部门档案数据具有追源考证、权益维护、矛盾调解等价值作用,是城市管理与建设、经济社会发展的重要记录,是社会治理与发展的重要基础数据。

2 机关档案数据治理作用与意义

2.1 推动档案数据精细化管理

现阶段,机关档案数据管理的主要对象是以文件形式存在的档案数据,以信息形式存在的档案数据往往被忽视,如用户利用数据、文件内容数据、统计分析数据等都未能纳入档案数据管理工作中。档案数据治理将改变传统管理对象的范畴,是基于对数据信息本身的治理,重在对“数据”本身的组织、管理、分析与利用,“数据”尺度的管理工作比“文件”尺度更深入、更细致[5],更有利于实现对档案数据精细化管理,为档案数据智能化分析与开放利用提供数据基础。

2.2 规范数据采集,提升档案数据质量

机关档案数据具有多源性、异构性,存在不同系统产生的数据格式不一致、数据项缺失、数据冗余重复、数据验证方式差异等问题。基于信息生命周期的档案数据治理,是对档案数据从产生到消亡的各个阶段进行全方位治理[6],从档案数据生产、收集、组织、分析、存储、利用、销毁等各环节进行规范化、流程化、标准化控制与治理,将极大地提升档案数据质量,为保全档案数据证据性、凭证性提供了质量保障。

2.3 发挥档案数据资政服务作用

政府机关档案是记录和反映政府部门在不同历史时期工作的情况,是社会管理和城市发展的重要历史记录,是重要数据资源,对政府部门总结城市发展规律、推动管理决策、提升社会治理水平具有重要的参考价值。开展机关档案数据治理,深度开发数据价值,有利于提升档案数据资政服务能力,为领导决策提供有力支持。

2.4 满足档案数据高度共享需求

传统档案管理“重藏轻用”、“重文件轻数据”、“重后端轻前端”,造成了档案数据信息孤岛、横向与纵向共享路径不通畅等问题,数据治理以“数据”为核心,以用途为导向,抛弃原有数据管理部门的本位主义,强调数据价值的发挥与应用,通过打通数据传输通道,横向联接业务数据管理与利用部门、纵向联结上下级数据管理与应用部门,可满足机关单位内部、上级业务主管部门之间的数据开发与共享。

3 机关档案数据治理路径与实现

3.1 机关档案数据治理路径

随着档案信息化发展,各类政府机关单位已积累了大量的档案数据,为进一步挖掘档案数据价值,真正发挥档案数据在社会治理中的作用,需在现有档案数据管理基础上开展数据治理方面的设计与实施,建立合理的数据治理路径,有序推进相关工作的开展,具体步骤如图1所示。

1)培养数据治理理念。随着电子政务的发展,无纸化办公将成为政府部门未来主流办公方式,各类办公数据成为政府档案管理部门的重要数据源,数据将成为社会治理的重要基础。因此,培养政府机构领导者和档案管理者的数据治理理念显得尤为必要,只有认识到档案数据治理的重要性、紧迫性、必要性,形成对档案数据治理的积极态度,才能真正地将数据治理工作落到实处。同时,档案管理部门可面向管理者、业务经办人员、专(兼)职档案管理员,开展培训、讲座等,宣传档案数据治理念及应用成果,增强数据治理意识,提升数据管理责任意识。

2)建立数据治理标准体系。标准是指“衡量事物的准则”,或者“本身合于准则,可供同类事物比较核对的事物。”[7]参照已有国内外相关标准规范,制定档案数据治理标准规范体系,对数据的内容、数据的管理、技术手段、操作规程、质量评估以及数据转换精度等方面进行全面的规定,保障数据质量可靠稳定、规范数据管理和应用过程,通过建立标准体系来保障档案数据治理成效。体系主要内容包括:数据标准,制定档案数据标准和相关技术操作规程,规范数据库标准、数据分类编码标准、元数据标准、数据质量标准等;技术规程,制定信息化工作程序规范、操作规程以及实施细则,制定数据采集、数据处理、数据质量控制等各工作流程环节的技术要求、操作程序和查验规范;服务标准,主要包括信息发布的标准、数据交换及分发的标准、应用接口的标准等。

3)设计数据资源分类框架。档案数据资源分类体系是数据收集、管理、组织的根本,是指导档案数据建设的重要依据,是控制数据质量与范围的第一道关卡。根据机关档案来源与类型,优化完善档案资源分类体系总体设计,建立统一的、规范的档案资源分类框架,为数据深度整合、高度共享提供数据基础。

4)搭建档案数据管理平台。大数据环境下的档案数据治理很大程度依赖于信息化技术,通常以档案信息系统为载体,以网络为通道,融合数据采集、管理、分析与服务等方面的信息技术支持数据治理相关工作的开展。结合档案业务管理实际,搭建集“收集”、“管理”、“保存”、“利用”于一体的档案数据管理平台,可实现各类档案数据接收与采集、处理与分析、存储与传输、利用与开放鉴定、数据处置与销毁等数据治理功能。同时,系统平台具备高度的可开放性、可扩展性,可满足档案基础业务应用和未来发展需求。

5)构建数据管理保障机制。数据治理作为一项长期工作,应构建包含制度、安全、人才与资金等方面的保障机制,以为档案数据管理提供可靠、长效、可持续的保障。一是建立档案数据治理战略方针,并有效融入政府部门整体数据治理工作,为数据治理具体工作指引方向;二是制定并完善档案数据安全管理策略,确保档案数据的有效验证、安全利用与长期保管;三是建设数据治理人员队伍,明确档案数据治理主体,将数据治理工作纳入档案管理岗位职责与绩效考核,设立专人专岗协调并配合完成档案数据治理相关工作;四是将档案数据治理工作经费纳入预算,设立档案数据治理工作专项经费,确保该项工作顺利进行。

3.2 机关档案数据治理的实现

按照档案数据治理路径,结合档案管理工作实际,遵循信息生命周期管理原则,将机关档案数据治理工作划分为数据生产与收集、数据处理与分析、数据存储与传输、数据利用与开放、数据处置与销毁等5个环节,同时在各项治理环节中贯穿数据治理标准与规范,确保治理活动操作规范、数据质量规范,再依托数据治理平台完成各环节的具体工作,具体实现路径如图2所示。

数据治理环节是基于信息生命周期理论,呈现了数据从产生到消亡的动态、循环过程。

对应不同环节,在实际数据治理过程中,将不同的标准、规范应用到相应的环节中,确保对全生命周期中数据质量的规范控制。数据生产与收集阶段,主要采用数据分类、元数据方案、文件封装规范、归档数据接口规范等标准;数据处理与分析阶段,主要采用电子档案数据“四性检测”方案、OCR光学字符识别技术规范、归档文件信息著录规范与档案鉴定规定等标准制度;数据存储与传输阶段,主要采用数据库设计规范、档案数据安全管理与保存制度、系统及应用安全管理规定等规范制度;数据利用与开放阶段,主要采用数据服务接口规范、档案利用制度、政务信息公开条例等规范与规章制度;数据处置与销毁阶段,主要采用档案处置制度与档案销毁制度。

数据治理平台包含了数据生产系统、档案管理系统、数据存储系统、数据服务平台等4个管理与服务系统。其中,数据生产系统主要包含OA办公自动化系统等业务系统,以及生产传统载体归档文件材料的业务部门,是档案数据产生的源头;档案管理系统完成对数据生产系统中产生的原生电子文件及其元数据、传统载体文件材料的接收登记与元数据采集,同时还承担着对归档电子文件材料进行自动或人工辅助的分类与保管期限鉴定、元数据信息的自动捕获与自动编目、归档数据校验、归档文件OCR识别、数据统计、开放鉴定、到期鉴定、销毁鉴定等数据处理、分析与处置销毁工作;数据存储系统主要完成对各类档案数据的在线、进线、离线存储,同时借助网络进行存储数据的传输;数据服务平台主要包含了基于局域内网的档案在线浏览、借阅与数据共享服务,还包括基于互联网的官方网站信息公开与微信公众服务号等服务。

4 结束语

数据治理已成为政府部门提升社会治理的新途径,档案管理部门开展档案数据治理工作,建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制[8],有利于推动档案数据开放共享,促进档案数据融合与资源整合,将极大提升档案数据分析能力,为政府部门有效处理相关社会问题提供数据支持。政府部门积极开展档案数据治理,将档案数据治理工作纳入本部门数据治理体系中,将最大程度发挥档案数据价值,为社会治理、数字城市建设提供数据支撑。

参考文献

[1]中华人民共和国中央政府.国务院印发《促进大数据发展行动纲要》[EB/OL][2020-06-15].

http://www.gov.cn/xinwen/2015-09/05/content_2925284.htm.

[2]中华人民共和国国家档案局.在全国档案局局长会议上的工作报告[EB/OL][2020-07-14].

http://www.saac.gov.cn/daj/yaow/201801/4620821e0eb549c389abef95d4b8af36.shtml.

[3]江苏档案.档案,正在成为治国理政的重要基础性力量[EB/OL][2020-06-15].

https://mp.weixin.qq.com/s/1RM2m7jekzxs9d9rWHMfLw.

[4]中华人民共和国国家档案局.国家档案局发布第13号令《机关档案管理规定》[EB/OL][2020-07-14].http://www.saac.gov.cn/daj/xxgk/201810/8515c1f79e904e08aef8bf63dcc9b1f7.shtml.

[5]钱毅,刘涛.面向智能档案管理的企业数据治理路径研究[J].山西档案,2018(02):5-8.

[6]胡晓庆.信息生命周期理论视角下的档案数据治理策略研究[J/OL][2020-06-11].山西档案.

http://kns.cnki.net/kcms/detail/14.1162.g2.20200521.2043.004.html.

[7]中国社会科学院语言研究所词典编辑室.现代汉语词典.北京:商务印书馆,1988:70.

[8]华人民共和国中央政府.国务院关于印发促进大数据发展行动纲要的通知[EB/OL]

[2020-06-15].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

作者简介

曾婷(1988-),馆员,主要从事档案信息化建设。

危娅婷(1994-),助理馆员,主要从事档案信息化建设。

王恒(1988-),工程师,主要从事办公自动化与自然资源和规划信息化建设。

*本文暂不支持打印功能

monitor