- 收藏
- 加入书签
基于改进残差网络与专家知识蒸馏技术的书法美感评测研究
摘要:针对目前书法作品智能评价存在特征提取不全面、评价体系单一的问题,本文提出了一种结合改进的ResNet101模型和专家知识蒸馏技术的书法美感评测方法。方法通过改进的深度残差网络提取书法作品中的复杂和细腻特征,并利用知识蒸馏技术将专家的评价标准和经验转化为软标签。研究使用某省近5年的书法水平考试数据集,包含大量书法作品和丰富的专家评测结果。实验结果表明,本方法在书法美感评测中表现出较高的准确率和可靠性,对书法教育和评价具有重要的实际意义。
关键词:书法美感评测;ResNet101;软标签
引言
在书法评价领域,传统的评价方法主要依赖于专家的主观判断,这种方法虽然具有丰富的艺术鉴赏经验,但缺乏客观性和量化的分析手段。随着人工智能技术的发展,尤其是深度学习技术的进步,书法评价方法开始向自动化和智能化转变。这些自动化评价方法借鉴人工评价流程,主要专注于探索汉字的特征构建和优化特征提取方法,通过提取书法评价标准中的笔画、结构等特征,再以设定的评价规则设计评价系统计算评分。
一些研究者基于图像处理技术人工提取特征,如轮廓、骨架等。孙家豪[1]提出了一种书法汉字全局特征和局部特征相似度对比的评判方法,使用笔画拐点特征参数和骨架的相似度与相应标准库汉字特征进行对比,从整体和局部两个方面进行计算和评判。肖艾迪[2]针对提取汉字特征时维度过大、特征边缘化的问题,结合汉字网格技术提出一种基于网格的分层HOG特征提取算法,可以降低特征维度。人为进行特征的选取较为复杂和困难,而且特征选取的质量会对最终的评判结果产生关键性的影响,因而目前通过人为选取特征的方式进行书写质量的评判效果并不太理想。
近年来,深度学习技术尤其是卷积神经网络(CNN)在图像识别和特征提取方面展现出强大的能力。部分学者采用深度学习和人工提取特征相结合的方式,并且设计基于相似度计算的评分体系进行美感评估。洪微[3]认为汉字物理中心特征向量、汉字凸包中心特征向量和第一层卷积特征图中第十九张特征图向量对于汉字美感评分有重要的作用,因此基于三种特征向量设计了一种手写汉字美感评分系统。王凯[4]将汉字识别网络中的卷积网络层拆分出来提取汉字笔画特征,使用该向量计算余弦相似度得到汉字美感评分。这些方法采用深度学习方法提取书法字的部分特征,难以表达图像复杂、细腻的深层信息,对图像的表征能力较弱。
尽管现有的研究在书法评价的自动化和智能化方面取得了一定的进展,但仍存在特征提取不全面、评价规则过于简化等问题。本研究的数据集来源于某省近5年书法水平考试,涵盖了丰富的书法作品及专家评测结果。这一数据集的规模和质量为采用深度学习技术进行特征提取提供了充分保证。数据集中包含专家对书法作品的详细评价,通过知识蒸馏技术将专家知识迁移到神经网络中,以专家知识蒸馏训练策略学习专家的评价标准,可实现更准确、客观的书法美感评测。
因此,本文提出一种改进的ResNet模型和专家知识蒸馏训练策略结合的方法:ResNet模型通过引入残差学习框架,能够学习到非常复杂和细致的图像特征,知识蒸馏技术作为一种模型压缩方法,可以用来将专家的评价标准和经验转化为模型可以理解的软标签,将专家知识迁移到训练模型中,从而提高评价的准确性和效率。
1 理论与方法
在书法作品中,笔画细节、结构层次以及整体布局都非常丰富,需要深层网络来充分提取这些特征,本文将ResNet101作为基础网络模型,其深层结构适合捕捉图像中的复杂和细腻特征。本文所提出的网络架构详见图1。该网络接收学生书法作品的扫描图像作为输入,通过本文设计的特殊卷积层以及一系列残差模块以执行特征提取。在网络的最后一层,集成了五个多层感知器(MLP),每个感知器对应一个特定的书法评估任务,并独立输出预测结果。所有感知器均共享网络的底层特征提取层,通过残差连接机制增强特征表示能力。
1.1 改进的resnet101模型
在书法作品的智能评测中,特征提取的准确性至关重要。然而,现有的特征提取方法大多针对传统图像处理,无法应对书法作品中的细腻笔画和独特结构特征。本研究中的书法作品由以网格形式排列的单字组成,评估的关键在于每个字的书写质量。为提高特征提取能力,本文设计了一种改进的深度残差网络模型,特别针对卷积层进行优化,旨在优化残差网络对书法作品独特结构的敏感度,确保评估的全面性和准确性,具体地算法包括:在残差网络第一层,增加特殊卷积核,卷积核大小设计为可完全覆盖单个字的尺寸,以捕捉字的细节特征;将特殊卷积核步幅设置为单字大小,确保每次卷积操作都覆盖下一个字,以精确提取各字特征,避免信息丢失,同时减少背景噪音对评估的影响。通过这种设置,特殊卷积核产生的特征图每个位置对应于一个字的特征表示,确保每个字的特征能被单独分析和评估。
1.1 专家知识蒸馏训练策略
在艺术作品评价、医学诊断等复杂任务中,专家经验指导的评价标准往往不是一个类别标签即硬目标,而是每个类别的概率分布即软目标。软目标中包含了更多的“暗知识”(dark knowledge),即不同类别之间的相对关系,有助于模型更好地理解数据。
专家知识蒸馏训练策略强调将专家的知识和经验融入模型训练过程中,通过模仿专家的评价标准来训练模型,旨在提高模型在特定领域的准确性和可靠性。通过将专家的评价转化为软标签,并使用这些软标签来训练模型,使得模型能够学习到专家评价中的细微差别和深层次特征。
本研究中的每幅书法作品,由五位专家分别对“优秀”、“合格”、“不合格”等评分等级进行投票。将每个评分等级的投票数转换为概率分布,设Vi为第i个评分等级的投票数,总投票数为Vtotal,则第i个评分等级的概率Zi为:
引入温度参数T,使用Softmax函数将调整后的概率分布转换为软目标:
其中,Si是经过Softmax函数处理后的概率。T是温度参数(temperature),用于控制输出概率分布的平滑程度。知识蒸馏的目标是使学生模型的输出接近教师模型的软目标,可以通过交叉熵损失函数来计算学生模型输出与软标签之间的蒸馏损失:
其中,pi是教师模型对第i个评分等级的软目标输出,qi是学生模型对第i个评分等级的输出概率。
2 实验设计
2.1 实验数据
本文实验选择某省书法水平考试数据集,数据集中包含硬笔1-3级考试中对临作品,包含对作品笔画、章法、结构、卷面四个维度以及总评的优秀、合格、不合格和零分四类测评结果,共约227000张。将数据集按照70%、30%的比例随机划分为训练集和测试集。随后,对图像进行预处理,统一调整为224×224像素,以满足网络输入要求。鉴于数据集中各类别的样本数量存在不平衡,本研究采用了加权调整策略,以确保在采样过程中各类样本被等概率选取。
2.2 实验环境及参数设置
实验环境配置为:11th Gen Intel(R) Core(TM) i5-11400 @ 2.60GHz处理器,双通道16GB内存,NVDIA GeForce RTX3070 12GB显存的GPU,Windows 10系统环境及Pytorch3.8框架。
针对ResNet的5种网络深度进行实验发现,随着网络层数的不断加深,准确率逐渐提升,参数量也随之增加。综合考量系统硬件及模型分类准确率,选用ResNet101作为基础网络架构。在选择优化器时,分别测试了不同学习率的SGD与Adam对实验结果的影响,并根据实验结果最终选取了SGD作为本文实验的优化器,且SGD的初始学习率设置为0.01时实验结果最佳。实验使用了多种权重初始化方法对网络参数进行初始化,经测试发现不同的权重初始化方式对最终的实验结果并没有显著的影响。将步长设置为与汉字大小相同,每次卷积操作能刚好覆盖一个完整的汉字,避免卷积操作中遗漏或重复学习汉字的部分特征。这种设置能够确保每个汉字都被完整地学习,从而提高模型对汉字细节的关注度,batch-size设置为32,动量为0.5,训练次数epoch为100,若Loss在100个epoch的最后阶段仍有下降,则再增加50个epoch的训练周期。将5位专家评价结果转化为软标签作为模型输出的目标值,使用交叉熵损失函数计算损失,优化目标为最小化损失值。
2.3 实验结果及分析
2.3.1 实验对比结果
为了验证本文模型的有效性,选取已有研究中的人工提取骨架特征+余弦相似度、卷积网络提取部分特征+余弦相似度分类方法进行对比分析。评价指标采用总体分类准确率(Accuracy),公式为:
其中,TP表示实际为正且预测为正的样本数,TN表示实际为负且预测为负的样本数,FP表示实际为负但预测为正的样本数,FN表示实际为正但预测为负的样本数。
2.3.2 消融实验
为验证本研究所提出方法的有效性,设计了消融实验,对比ResNet101、ResNet101结合软标签策略以及本研究提出的模型。本节所涉及的消融实验选取了2023年某省硬笔书法考试数据集作为测试样本,共3019幅书法作品,且实验条件严格遵循训练阶段的设置。在模型训练过程中,损失函数值的变化曲线如图3所示,模型准确率的变化曲线图4所示。
根据图3和图4,可以观察到本研究提出的模型在训练过程中实现了最低的损失值和最高的准确率,相较于其他模型表现更为优异。通过分析各模型的损失曲线和训练准确率,可以对比ResNet101网络与ResNet101结合软标签策略的效果,进而评估软标签策略的有效性;同时,通过对比ResNet101结合软标签策略与本研究中改进的ResNet101结合软标签策略,可以评估对ResNet101网络结构进行优化的有效性。
3 结论
本文提出了一种改进的深度残差网络模型,可有效地学习书法作品中复杂和细致的图像特征,这一机制显著提高了模型对书法美感特征的捕捉能力,为书法美感评测提供了强有力的特征支持。同时,专家知识蒸馏技术的训练策略使得专家的评价标准和丰富经验得以转化为模型可以理解的软标签。本文方法在实验中显示出较高的准确率,不仅提高了书法美感评测的效率,也确保了评价结果的可靠性和精确性,对于书法教育和艺术评价领域具有重要的实际意义。
参考文献
[1]孙家豪. 一种书法汉字智能评价方法的研究与实现_孙家豪[D]. 湖北工业大学, 2020
[2]肖爱迪,骆力明,刘杰. 改进的HOG和SVM的硬笔汉字分类算法[J]. 计算机工程与设计, 2022, 43(08): 2236-2243.
[3]洪微. 基于深度学习的汉字字形美感评分_洪微[D]. 昆明理工大学, 2021
[4]王凯. 基于深度学习的手写汉字识别与书写质量评判研究_王凯[D]. 中南财经政法大学, 2021





京公网安备 11011302003690号