
- 收藏
- 加入书签
基于深度学习的二次元剪纸风格化生成算法
摘要:随着数字化时代的到来,中国传统的剪纸艺术面临着前所未有的挑战,包括内容创新不足和传承人才短缺等问题。为应对这些挑战,本文提出一种融合剪纸艺术与二次元文化的创新方法。通过采用快速图像风格迁移技术,本文成功实现了将任意二次元图像剪纸风格化。此外,为了提高风格化的效果,本文还采用了图像预处理和后处理技术,如基于图像分割的背景替换和色彩压缩,以去除不符合剪纸风格的元素,增强输出图像的视觉质量。实验结果表明,该方法不仅保留了原始二次元图像的内容特征,还成功融入了剪纸艺术的独特风格。本文的工作为传统剪纸艺术的发展提供了新的方向,同时也有助于促进二次元文化的多元化发展,吸引更多年轻人对传统艺术的关注和参与。未来,随着技术的不断进步,期待能够探索出更多创新方法,进一步丰富剪纸艺术的表现形式,推动其在现代社会中的传承和发展。
关键词:剪纸;二次元;快速图像风格迁移;色彩压缩;图像分割
引言
剪纸作为中国源远流长的传统文化符号,其独特的艺术风格和背后所蕴含的深厚文化内涵,对中国人而言具有着不可替代的价值。这一艺术形式不仅凝聚了中华民族数千年的智慧和情感,更是传承和弘扬中华民族优秀传统文化的重要载体。2006年5月20日,经国务院批准,剪纸被列入第一批国家级非物质文化遗产名录。2009年,中国剪纸入选联合国教科文组织人类非物质文化遗产代表作名录[1]。
然而,进入21世纪以来,由于经济全球化、社会现代化和数字文化发展冲击,剪纸面临着前所未有的挑战。一方面,传统剪纸的主题内容往往固化,缺乏创新,难以适应现代社会的审美需求;另一方面,传承队伍的力量不足,缺乏年轻人才的加入,使得剪纸艺术的传承与发展面临困境[2]。在数字时代背景下,剪纸艺术必需寻求创新与发展,实现“剪纸艺术+”转型,破除剪纸面临的困境,为其传承与发展注入新的活力。
近年来,二次元文化在全球范围的发展成果令人瞩目。这一独特的文化现象,不仅深深吸引着年轻一代,更在多个领域展现出其强大的影响力和生命力。据统计,从1995年开始,截止到2019年出生的人口数量达到4.3亿人,网络活跃用户在2020年已超过3.2亿人,而对二次元有一定理解,有过二次元消费行为的泛二次元人数甚至占比高达95%[3]。在未来,随着技术的不断进步和市场的不断扩大,二次元文化有望继续保持着其火热的态势,并为全球文化的发展注入新的活力。
因此,本文寄希望于一种新的剪纸艺术形式,将剪纸艺术与二次元文化相结合。剪纸艺术因其图案寓意丰富而受到广泛赞誉,体现了人们对美好生活、吉祥如意的祝愿。同时,二次元文化以其触动情感的角色和故事情节备受年轻人欢迎。将剪纸文化与二次元文化相融合,不仅有助于弘扬剪纸艺术的特色,吸引年轻人的兴趣,也能够为传统剪纸文化赋予新的能量,推动文化自信和文明交流。
1 快速图像风格迁移
1.1技术原理
传统的图像风格迁移被视为纹理合成的扩展问题,其目标是将一幅图像的纹理或“风格”迁移到另一幅图像的内容上[5]。这些传统方法主要基于像素级别的底层图像特征,往往忽视了图像中的高层语义信息,导致图像的迁移结果并不理想。2015年,Gatys等人提出了基于卷积神经网络(CNN)的图像风格迁移方法,该方法通过训练一个预训练的CNN模型(如VGG网络)来提取图像的内容和风格特征,并使用Gram矩阵来捕捉图像的风格信息。然后从随机噪声图像开始,经过多次迭代优化生成具有原内容和新风格地图像[6]。但该方法计算复杂度较高,每张图片都需要经过上千次的迭代优化,处理速度较慢。之后Johnson等人提出了快速的风格迁移方法,利用前馈神经网络,直接学习从输入图像到输出风格图像的映射关系,从而实现实时的风格迁移[7]。
本文采用快速图像风格迁移技术,使用一个网络直接生成二次元剪纸风格化图像。对应的网络结构如图 1快速图像风格迁移的网络结构所示。
整个网络结构包括两个网络,左边的图像生成网络和右边的损失网络。图像生成网路是一个可训练的神将网络,它输入的是一张内容图像,输出的是融合了目标风格后的图像。损失网络是一个预训练好的神经网络VGGNet,并利用该网络定义内容损失和风格损失。内容损失用于衡量生成图像和内容图像在内容上的相似性,使用的是 VGG-16 的 relu3_3 层输出的特征。风格损失用于衡量生成图像和目标风格图像在风格上的相似性,使用的是 VGG-16 的四个中间层 relu1_2,relu2_2,relu3_3,relu4_3。同样组合这两个损失函数得到一个总损失,并利用该损失函数训练图像生成网路。训练完成后便可以直接利用图像生成网络生成特定风格的图像[8]。
1.2模型训练
1.2.3训练过程
经过多轮迭代训练后,图像生成网络的表现将显著提升,所生成的图像不仅保留了原始图像的内容特色,同时成功地融入了剪纸的艺术风格。如图 4所示,分别为训练过程中内容损失、风格损失和总损失的变化曲线,从中可以清晰地观察到它们随着训练轮次的增加而逐渐减小,并最终趋于收敛。这一趋势表明,网络模型正在不断优化,并逐步接近理想的训练效果。
2图像预处理与后处理
2.1色彩压缩
在剪纸艺术中,颜色对于保持其独特的风格和美感至关重要。然而,图像生成网络直接生成的图像出现了非剪纸颜色的杂色,如蓝、绿色等。因此,还需对生成的图像进行处理,确保其仅包含红色和白色这两种符合剪纸艺术风格的颜色。
本文基于色彩压缩的方法对图像进行后处理解决该问题。该方法的核心思想是通过计算每个像素与红色和白色这两种目标颜色的欧氏距离,来判断该像素应该被赋予哪种颜色[9]。
具体而言,首先对图像中的每个像素进行遍历,并计算该像素在RGB颜色空间中与红色和白色这两种目标颜色的欧氏距离。然后,比较这两个距离值,将像素的颜色设置为距离更小的目标颜色。这种色彩压缩方法能够有效地去除图像中不属于剪纸艺术的颜色,确保生成的图片仅包含红色和白色。同时,该方法是基于像素级别的操作,能够保留图像的细节和纹理信息,使得生成的图片在视觉上更加逼真和生动,如图2所示。
2.2背景替换
图像的背景对最终图像生成的效果具有显著影响。当输入图像的背景为黑色时,相较于白色背景,其生成的剪纸风格图像在视觉效果上表现更为出色。这不仅体现在图像界限的清晰分明上,更在图像颜色的均匀和贴合度上得到了显著提升。
这一现象的背后,可能源于图像处理中的一些基本原理。在数字图像处理中,黑色(RGB值为0,0,0)通常被视为一个“中性”或“安全”的颜色,因为它在色彩空间中处于最底部,不会与任何其他颜色产生混色效应。这种特性有助于保持剪纸风格的清晰度和色彩纯度,确保在风格迁移过程中主体部分的细节和色彩得以完整保留。相比之下,白色(RGB值为255,255,255)则具有更高的亮度,容易与其他颜色产生混色效应。在风格迁移的过程中,这种混色效应可能导致处理后的图像色彩失真或模糊,从而影响最终生成效果。此外,黑色背景相较于白色背景通常具有更高的对比度,这种高对比度使得图像中的主体部分更加突出,有助于网络模型更好地分离和提取内容图像中的关键信息和融合剪纸风格。
3实验结果与分析
本文算法的生成效果,通过快速图像风格迁移方法,结合图像的预处理和后处理步骤,成功地将二次元图片转化为具有剪纸艺术特色的风格化图像。这种风格迁移不仅有效融合了剪纸的独特韵味,还巧妙地保留了原图中的关键特征内容。无论是人物的五官还是头发等细节,都得以精准地呈现,并在风格化的过程中保持了高度的辨识度。
该算法也存在不足之处,算法在处理剪纸风格的连通性方面存在不足。传统剪纸艺术强调图案之间的连续性和完整性,而本文算法在生成风格化图像时,并未充分考虑到这一点,导致部分输出图像在剪纸元素的连通性上表现欠佳。此外,虽然算法能够生成具有剪纸风格的线条勾勒,但与传统剪纸作品相比,这些线条勾勒显得相对简单,缺乏传统剪纸所特有的精美镂空和复杂纹样。这一不足在将风格化图像进一步转化为实际剪纸作品时尤为明显,可能带来额外的制作难度。
4结语
本文提出了一种基于快速图像风格迁移的二次元剪纸生成方法,可以将任意的二次元图片转化为独特的剪纸风格。通过使用快速图像风格迁移技术,首先实现了对输入图像的初步转换。鉴于二次元图片的独特风格,特别选取了二次元图片数据集进行模型的训练,以确保模型能够准确地提取并保留二次元图片的独有特征。为了进一步提升剪纸风格化效果,本文基于图像分割技术对输入图像进行预处理。通过对输入图像进行分割,提取出图像主体部分并赋予黑色背景,从而突出图像特征和更好融入剪纸。展望未来,可以进一步探索和创新。通过选用不同风格的剪纸图像,可以得到风格各异的二次元风格化图像,为二次元文化注入更多元化的艺术元素。同时,还可以尝试采用图像色彩迁移技术,将输入图像的原始色彩迁移到输出图像上,在保留原有内容和颜色的基础上,融合剪纸的风格特征。这将使生成的图像更加生动、真实,提供更多个性化的选择。
本文提出的基于快速图像风格迁移的二次元剪纸生成方法,为二次元文化与剪纸艺术的结合开辟了新的途径。通过不断的技术创新和优化,有望为剪纸艺术在新时代的发展注入新的活力,并吸引更多年轻人的加入和关注。
参考文献:
[1]中国非物质文化遗产网.【非遗数据知多少】国家级非遗代表性项目:剪纸[EB/OL]. (2024-06-10)[2024-06-10].
该文章受到上海立信会计金融学院大学生创新创业训练计划项目资助,项目编号为S202411047018,指导老师:林静