- 收藏
- 加入书签
精准资助视域下高校家庭经济困难生认定指标模型对比研究
【摘要】高校学生精准资助工作关系到高等教育事业的健康长足发展,做好家庭经济困难生认定工作是推动精准资助的前提条件。本文从高校贫困生认定工作的现状和存在困难出发,引出构建一套科学、完善的贫困生认定指标模型的必要性,并将现存的国内外贫困生认定模型进行对比研究,归纳出基于目标案例特征的案例推理法、基于模糊数学理论的模糊分析法、基于大数据分析的数据挖掘法、基于神经网络的深度学习算法等几种贫困生认定模型类型,对推动构建科学精准的贫困生认定指标模型提供思路。
【关键词】精准资助;家庭经济困难生认定;指标模型;大数据
高校家庭经济困难生认定,其专业术语为贫困生认定( detemination of needy student),其对象是指本人及其家庭的经济能力难以满足在校期间的学习、生活基本支出的学生[1],其认定工作是指按照一定的标准界定一个大学生家庭经济困难与否以及达到何种困难程度,进一步确定其获得相应等级的助学金资助。江苏省教育厅提出,要在全省范围内组织实施建立家庭经济困难学生精准资助长效机制改革试点工作,联合多方资源,对家庭经济困难学生开展生活帮困、学习帮助、心理帮扶等资助服务,推动资助方式兼具“标准化”和“定制化”[2]。
当前,在全国新冠疫情发展的新形势下,高校在困难学生精准识别方面还存在着一些现实问题,主要在于前期排查不全面、评议过程不精细、数据来源不充实、量化指标不完备、认定结果不精准,出现这些问题的深层原因除了学校、学院、班级等层面对于学生资助工作的主观管理因素,更在于没有一套科学完善的量化指标标准在全校乃至全省所有高校范围内执行。资助方式“标准化”和“定制化”的实现,其根本就在于制定一套精准科学的贫困生认定指标模型。因此,分析研究现存不同的贫困生认定指标模型,推动构建科学精准的评估模型是精准资助背景下高校家庭经济困难生认定的核心要义。
一、高校家庭经济困难生精准认定的现状
(一)过度依赖佐证材料,忽视实际情况
如今高校班主任由于自身工作繁重或者对最新政策把握不到位,在开展班级贫困生认定工作中一味地依赖学生的贫困证明材料,没有对材料的真伪辩证看待,对宿舍走访、寒暑假家访、联系家长、学生调研等多渠道、全方面的贫困生认定过程没有精细化掌握,有些学生因为家中老人不识字、不会拍照、疫区或灾区无法出门办理材料、山区快递不通、家中病人不便办理等等各种实际问题而无法按时提交佐证材料,各地方各县区对贫困证明材料的开具难度、建档立卡户的识别标准也不相统一,加之个别家庭经济困难生自尊心较高,内心较为敏感,不主动提供材料,班主任没有关心了解到位,导致有些特别困难学生无法精准识别和认定,制约了后期的精准资助工作。
(二)偏重定性的民主评议,主观影响大
当前高校贫困生认定的班级民主评议环节都是对贫困学生进行定性评议,认定结果依赖于学生评价和投票结果。对于大一新生,在互不了解的情况下容易出现不合理的投票结果;对于老生,更可能存在不公平的拉票现象,学生更可能倾向于同宿舍室友或者关系要好的同学,常常出现个别同学因为人脉问题而导致评议不通过,无法认定贫困生而获得资助,但其家庭经济困难真实存在。班级民主评议是基于同学们对贫困生的在校表现、消费情况、电子产品使用情况、衣着打扮等方面的评价,并不深入其家庭进行了解,大多贫困生也不愿主动说明家庭情况,个别自尊心强的贫困生甚至也会使用一些高档电子产品造成假象,但这并不直接意味着家庭经济不困难,导致影响认定的精确性。所以,偏重依赖定性的民主评议,主观性太强,需要一套定量评价手段的认定指标模型来实现精准认定。
(三)大数据共享程度不高,数据来源单一化
随着信息化数字化时代的发展,智慧校园、智慧课堂为高校的信息化管理提供了诸多便利,高校对学生家庭经济困难情况进行识别的途径和方式也得到了拓展,但仍存在一定的局限性。当前,学生在省学生资助管理系统提交贫困生申请,上传的佐证材料来源于各县区的村委会、居委会、街道办、扶贫办或民政系统,其数据库与全国系统、省系统、高校系统之间多少会存在偏差,共享程度不高。同时,数据来源较为单一,系统数据被过度依赖,数据信息更新迟滞,没有结合更新的、更为实际和全面的方面,这需要各部门数据的全面共享和大数据技术的不断提升,从而提高认定的范围和效率。
(四)认定指标较为单薄,模型精准度不高
当前的省学生资助管理系统认定指标限于学生家庭经济状况的基础数据,其他实际数据并没有纳入综合考虑,比如学生在校的一卡通消费数据、学生在校实际的微信支付宝消费数据、国家开发银行助学贷款申请数据、各地县区民政系统的建档立卡、低保数据库等等,并没有直接纳入省资助系统指标体系中,导致贫困生认定工作中常常出现系统比对不一致情况,影响真实精准认定。而且,各指标权重和计算模型存在偏差,在实际测试和应用中可以发现,系统量化评估分数会随着某一指标的修改、某些材料照片的上传会产生较大的波动,而后台并不会对证明材料的内容进行识别,还需要后期人工逐一修正,增加了资助工作的繁重,降低了认定效率。可见,建立一套科学、完善的家庭经济困难生认定指标模型,是推动资助工作提质增效的重中之重。
二、家庭经济困难生认定指标对比分析
目前,国内外学者对家庭经济困难生认定指标模型的建立主要是结合主观评价和客观指标,通过收集大量认定指标的基础数据,用合理方法确定指标权重,最后运用数学模型或算法进行计算,得出贫困生认定值。现存模型和方法有:粗糙集BP神经网络方法、开放性认定方法、自主评价法、AHP-CBR分级认定模型、模糊综合分析法、人工神经网络、多指标综合、决策树 C4.5、层次分析和模糊层次分析(FAHP) 、logistic 回归模型、SOA 法、数据挖据、分类聚类法、ASP.NET平台和B/S方法、信息视角、FP-growth、三角白化权函数灰色评估等[3]。笔者通过对比分析这些模型的建构溯源,得到以下几种大类的贫困生认定模型分析方法,加以综合比较并分析优劣,对构建精准认定指标体系起到一定的指导作用。
(一)案例推理法
基于案例推理(Case-based Reasoning,CBR)是人工智能发展较为成熟的一个分支,它的思想就是基于旧的案例来解决新的问题,现阶段已广泛应用故障诊断、产品设计、交通控制等领域。基于案例推理系统的核心内容就是案例检索,也就是将新的问题作为问题求解的目标案例与案例库中的源案例开展特征比对,以选择与目标案例特征相近的源案例,并将源案例的求解结果作为目标案例的求解结果[4]。将资助政策纳入案例库组建和系统参数预设模块中,形成案例库,友申请者提交申请信息,系统进行数据有效性验证,以案例库为推理基础形成贫困生认定模块,最终在一定算法下生成贫困生信息库,进行建档立案,这是案例推理法的基本思路。由此看来,将案例推理法应用于高校贫困生认定指标模型构建中,可以生成基于案例推理的高校贫困生认定系统。
案例推理法用于认定困难学生具有低成本、计算方法简便的特点;但是案例的推理是基于过去的案例或者经验,灵活性较差,计算结果较为粗糙,还需要结合层次分析和数据挖掘来提高精度。
(二)模糊分析法
1、模糊综合评判法
模糊综合评判法是一种运用模糊数学原理,对具有“模糊性”事物进行分析和评价的系统方法,它是一种以模糊推理为主的精确与非精确相统一的、定性与定量相结合的分析评价方法。模糊综合评价法的一般程序是:首先确定被评判对象的评价集和因素集;再分别确定各因素的基本权重,获得模糊评判矩阵;最后把模糊评判矩阵和因素的权向量进行模糊运算,得到模糊评价综合结果[5]。根据复杂系统中涉及的评价集和因素集的不同,以及相互层次之间的差异及其影响,模糊综合评判法可以构建单层次模糊综合评判模型和多层次模糊综合评判模型。这种方法近年来在处理诸多复杂系统问题中表现出了独特的优越性和广泛的学科应用。
而要应用模糊综合评价法进行建模与实证,就需要构建评价集和因素集、计算权重及底层因素隶属度,在实际操作中一般选用“模糊层次分析法”解决这一问题。
2、模糊层次分析法
层次分析法(Analytic Hierarchy Process,AHP)是目前用来构建贫困生认定模型的最常用的建模理论,而模糊层次分析法是模糊数学理论中的一种应用方法,它在层次分析法的基础上综合了主观判断的模糊性,把一个复杂问题简化为了有序的递阶层次结构,把定性评价系统转化为定量评价系统,最后对权重进行标准化处理[5]。这是一种层次权重决策分析方法,能在某种程度上控制人为干扰因素带来的不确定性问题,在高校贫困生认定模型构建中起到了主导作用,其基本步骤如下:
(1)确定致贫因素集,构建贫困生认定指标体系
运用层次分析法进行贫困生认定指标体系构建,首先确定致贫因素集。致贫因素一般分为一级指标和二级指标,一级指标指的是九大致贫因素:父母工作类型、家庭所在地、家庭上学人口数、家庭劳动力人口数、父母学历、重大疾病患者、家庭人口数、遭遇突发事件、其他特殊情况,二级指标是每个一级指标下面的具体子指标。
(2)确定致贫因素组合权重,隶属度和评价值
首先,确立组合指标权重。依据模糊层次分析法原理,计算得到贫困生认定指标一级指标的权重ωUi,同理可计算得到各二级指标对于一级指标的权重ωUij,ωUi×ωUij,即为指标ωij的总权重。接着,确定评价值。根据底层因素隶属度与组合权重的乘积来确定评价值。然后,将已知的一级、二级致贫指标权重进行代入,求出组合权重和评价值,得到高校贫困生认定模型为:
其中ji表示一级指标Ui 下的二级指标的总个数,n表示一级指标的总数。该模型是通过大数据对家庭经济困难学生的各项综合信息进行归集、排序和计算,从而进行贫困生判别的一种量化评估方法。该模型可以对全学院申请贫困生的学生进行总权重值的排序,将所有贫困学生的各项指标进行量化评估,解决了大量数据下无法进行大范围量化比较的困境,较为适合高校推广使用。但是在该模型的指标体系里,对于建档立卡、低保、残疾、特困救助、孤儿等国家政策重点扶持的五类困难生,在指标体系和权重推算中没有得到重点突出,该模型的构建在下一步需要重点对此类人群因素中予以关注。
(三)数据挖掘法
1、大数据来源与处理
目前我国学者对高校贫困生认定的体系数据大多数是来源于高校一卡通大数据、学生的消费记录和消费行为、学生使用的电子产品、学生的助学贷款额度、勤工俭学记录、学生家庭成员登记、社会活动评价等方面。在全国疫情发展的时代下,因疫情影响家庭经济收入来源而致贫、或疫情突发状况等指标也急需纳入贫困生识别的致贫因素体系中。追溯这些大数据的来源,主要依赖于学校信息平台的学生一卡通消费数据、学校学生信息管理系统、学校财务系统、国家开发银行系统、省学生资助管理信息系统、学生生源地扶贫办、民政局、社区数据,甚至更多来源于腾讯公司和阿里公司后台的消费数据,这些数据来源于不同机构、不同地域、不同层面的数据库,且数据库信息量非常庞大、种类多样、形式复杂,这就必然存在数据不协同、不完整、不匹配、不真确等现实问题。对大数据进行统一管理的过程,除了需要搭建学生信息化一站式管理平台,也需要针对其中一项数据库进行数据处理和数据挖掘,即将原始数据进行转换,得到符合实验挖掘的数据格式[6]。
比如对高校学生一卡通消费数据进行数据处理,需要经历数据提取、数据清洗和特征计算等过程。具体来说,首先是在数据库里按照选取学生的年级以及在校消费的时间,提取的学生财务编号、交易时间、交易地点、交易类型、交易金额等数据;其次对已经提取的数据进行清洗:先找到数据计算缺失值,然后识别出一些无效和重复数据并进行去除,同时将不合理和矛盾数据进行删除或修正,将严重不符合的数据进行格式化处理。最后进行特征计算,对清洗的数据进行整合计算,得到新的特征变量,从而根据实际经验确定适用于高校贫困生认定的特定参数。数据挖掘可以提高数据源的有效性,从而推动模型的精确性,是大数据技术在贫困生认定工作中一项基础应用方法。
2、指标体系构建
根据处理好的数据,可以开展多维的定量指标体系构建。目前常见的贫困生认定指标体系主要有以下五种维度:一是家庭和个人,二是学生、家庭、学校,三是家庭生活、人力资源、学生情况和特殊经济情况,四是贫困程度、学习表现、节俭程度和德育素质,五是经济资源、人力资源、自然、个人因素和特殊因素。从上述的这些指标体系构建发展可以看到,随着信息化时代下大数据的发展,越来越多的指标纳入到贫困生识别维度中,比如家庭人均年收入、家庭负债总额、家庭劳动力占总成员比例、赡养老人情况、父母健康状况、本人健康状况、建档立卡、低保等情况、自有住房面积、家庭上年度遭遇重大事件造成财产损失额、家庭月医疗费用、家庭教育支出金额、个人月平均生活费、个人电子产品价值、校园一卡通饮食消费金额、往年受资助金额、往年助学贷款额度、月度勤工助学或兼职收入、个人社会服务评价等多维定量指标,构建多维指标的认定体系,展开贫困生的贫困指数认定工作。
(四)深度学习算法
深度学习是利用选中的数据库对模型加以测试和训练,将数据中蕴藏的大量信息通过机器学习算法不断归集和应用到模型中,利用训练好的模型对现实世界中的相似数据进行特定处理。利用算法程序对贫困生认定模型进行建立、测试、训练和处理,是信息化时代下大数据技术和深度学习算法在学生工作领域的技术性和革命性应用。
1、深度神经网络
深度神经网络(Deep Neural Networks,DNN)可以理解为有很多隐藏层面的神经网络。其主要优势是将神经网络的隐藏层扩展到多层中,解决了神经网络无法学习比较复杂的非线性模型的问题[7]。在贫困生认定模型中,将一卡通餐饮消费记录、助学贷款申请额度、已获资助记录、勤工俭学记录等训练集作为输入层,认定贫困等级作为输出层,通过前向计算、反向传播这一深度神经网络算法,辅助以随机梯度下降法获得训练模型。通过测试集验证训练模型的有效性,并将训练完成的有效模型应用到高校大学生贫困认定等级中。深度神经网络实现了无监督学习和监督学习的有机结合,一定程度上可以精准地完成贫困生认定工作。
2、机器学习系统
机器学习是对能通过经验自动改进的计算机算法的研究,可应用于高校贫困生识别系统,极限学习机(extreme learning machine,ELM)是一类基于前馈神经网络构建的机器学习系统或方法,具有训练速度快、泛化能力强的特点[8]。在保障数据客观性和不摄取学生隐私信息前提下,以学生一卡通消费数据、家庭子女数量这些客观数据为基础,采用交叉算法构建贫困认定模型特征,并针对贫困生数据集不平衡的特点,构建高校大学贫困认定模型,可以为校园精准资助提供现实评判依据。如何通过一种易于获得、客观公正、又能保护隐私的数据来直观反映出家庭年收入,从而进一步提高算法对高校贫困生的识别精确性,是深度学习算法在机器学习系统中的进一步研究重点。
结语
扶贫开发贵在精准,重在精准,成败之举在于精准。要进一步提高困难学生认定、预算分配、资助标准设定等工作的精准化水平,除了政策全面掌握、生源排查到位、提升民主评议规范化之外,贫困生认定指标模型的分析和完善也是新时代下信息化学生管理的新要求。对比研究国内外现存的各种认定模型和方法,比较发展趋势及其优劣,灵活运用大数据技术,可以对帮助构建一套科学完整的贫困生认定指标模型提供思路,推动建设科学、精准、有效的学生资助体系。
参考文献:
[1] 教育部等六部门关于做好家庭经济困难学生认定工作的指导意见[EB/OL]. http://www.moe.gov.cn/srcsite/A05/s7505/201811/t20181106_353764.html.2018-10-30
[2] 江苏精准资助家庭经济困难学生——推动资助方式兼具“标准化”和“定制化” [EB/OL]. 2021-11-16
[3] 唐业喜,王江生.大数据在高校贫困生认定中的运用实证分析——基于熵值模型[J].高教论坛,2019(06):74-77+115.
[4] 代祖华,何乐,曹琦.高校贫困生AHP-CBR分级认定模型建构[J]. 西北人口, 2017, 38 (05): 104-112+119.
[5] 毕鹤霞.大数据下高校贫困生确认模型构建——基于“模糊综合评判法”与“模糊层次分析法”集成的实证研究[J].高教探索,2016(08):105-114.
[6] 张建明. 基于数据挖掘的高校贫困生认定系统设计和分析[D].东南大学,2015.
[7] 吴乐乐,朱亚辉.基于深度神经网络的高校贫困生认定模型[J].电子测试,2020(01):88-89.
[8] 郑建华,朱蓉,刘双印,贺超波.基于双重扰动与核ELM融合的大学生贫困认定模型研究[J].重庆理工大学学报(自然科学), 2021,35(05):243-252.
作者简介:杨叶,硕士研究生,1992年7月 女,江苏南京人,助教 研究方向:思想政治教育
项目:本文系江苏省高校哲学社会科学课题《基于价值工程理论的疫情防控下高校资助长效机制研究2020SJB0833》阶段性成果;江苏省教育科学“十三五”规划学生资助制度改革研究专项课题《基于“四成教育”的大学生资助模式研究X-a/2018/21》阶段性成果;
京公网安备 11011302003690号