- 收藏
- 加入书签
基于图像去模糊的综述
1、介绍
随着5G时代的到来,智能手机和摄像机越来越普及,拍照成为人们记录生活的重要方式。但在拍照过程中我们也能发现有的照片存在模糊的情况,这严重影响了人们的视觉感受和生活体验。事实上,从相机推广开来就与图像模糊的问题相伴相随,同样图像去模糊的研究也就此成为一个重点研究方向。无论是深空探索领域、医学图像领域,还是军事科学领域、交通监控,都需要图像去模糊的协助。从上世纪六七十年代证明可以用图像处理算法解决图像模糊的问题,到现如今基于深度学习的去模糊方法成为研究的主流,这一切的发展也不过短短几十年的时间但图像去模糊技术的发展却是空前的。本文就图像去模糊领域的主要方法做了一个总体的概述,旨在为想要了解图像去模糊领域的爱好者对该领域有一个总体性的把握。
2、图像去模糊原理
想要更好地进行图像去模糊工作,首先应该弄清楚图像去模糊的基本原理,从源头入手加以解决。图像模糊主要由光线不足、相机抖动以及物体相对运动等原因造成,根据不同的模糊原因,图像模糊大体可分为均匀模糊和非均匀模糊,而图像模糊的过程大致可以表述为:
其中,y、k、*、x和n分别代表模糊图像、模糊核、卷积操作和噪声。基于此,图像去模糊的过程可以理解为根据模糊图像求解模糊核和清晰图像的过程,其数学形式如下:
显然,该过程是一个高度不匹配、非凸优化的问题,通常来说我们无法根据一个已知量求解两个未知量,这也是解决图像模糊问题的关键所在。
3、基于正则项的图像去模糊方法
工欲善其事,必先利其器。为了解决上述问题,基于正则项的图像去模糊方法应运而生,其数学形式如下:
其中,和分别代表清晰图像的正则项和模糊核的正则项。通过正则项的限定可以保证模糊核和清晰图像朝着所期望的方向恢复,但是这也直接决定一旦正则项选的不合理将导致图像去模糊结果的不尽如人意。而这种正则项通常是一种先验性的信息,即通过大量的观察、实验发现的一种普适性的图像或模糊核的规律。在本部分的后面段落将简要介绍几种经典的基于正则项的图像去模糊方法。
文献[3]提出了一种分段连续函数来模拟自然图像的对数密度函数,同时还提出一个新的平滑约束项作为局部先验,使二者共同构成了自然图像的正则信息。文献[4]提出了一种从透明度的角度估计运动模糊核的统一方法,并证明了使用这种透明度先验可以很容易地获得更好的去模糊结果。文献[5]提出在稀疏先验中添加一个附加项,它是一个由清晰潜在图像的局部颜色统计建立的颜色模型。文献[6]使用了一个比拉普拉斯分布更重尾的图像先验,并应用了一种增广拉格朗日的方法来解决这个非凸优化问题。文献[7]提出的正则化函数是图像高频上的L1范数与L2范数的比值,它可以很好地区分模糊图像和清晰图像。文献[8]提出了一个广义的、数学表示合理的L0稀疏表达式。该损失函数在迭代优化过程中可以有效地近似L0稀疏性。文献[9]发现并验证了清晰图像的暗通道的零元素明显多于模糊图像,根据这个特性引入了一个新的暗通道正则化项。
4.基于深度学习的图像去模糊方法
文献[10]最先提出将深度学习的理念运用到图像去模糊领域,通过神经网络来学习对应区域的运动模糊分布概率,再利用预测的模糊核来实现图像去模糊。显然,这种“两段式”的方法具有一定的进步性,但对于应用推广仍然比较复杂。受传统多尺度优化方法的启发以及图像工作其他领域的借鉴,多尺度的图像去模糊方法成为研究的主流。
文献[11]最早提出一种多尺度的卷积神经网络,其通过每个小尺度上的逐步恢复出原始尺寸的清晰图像,这种“真正”端到端的方式也具有启发式的意义。后来,文献[12]设计了一种尺度循环网络,它在每个尺度采用了编码解码的整体网络框架并添加跳跃连接,这极大地促进了网络收敛和梯度传播。同时,作者在训练阶段将各尺度的网络权值进行共享,这大大的减少了训练的时间、降低了训练的难度。但是,文献[13]发现并非所有的模块进行参数共享都是有效的,那些比例变化模块不应该进行参数共享,由此提出了一种有选择性的参数共享策略。由于上卷积操作需要花费大量的运行时间,文献[14]采用一种深度多补丁层次结构网络,其将原本每个不同尺度上的输入变成了每个层次中的多个补丁。最近,文献[15]提出了一种多阶段渐进的网络,通过在每个阶段加入通道注意力模块来更好地提取有用信息,并利用跨阶段的特征融合机制更好地利用前一阶段的特征。
除了多尺度的图像去模糊网络,基于对抗学习的去模糊网络同样有着不俗的性能表现。其原理大概是,通过生成器和鉴别器之间的不断博弈交替优化两个子网络性能,以达到以假乱真的效果。在图像去模糊领域,文献[16]采用了一种条件对抗网络,其生成器是带有全局跳跃连接的卷积神经网络。后来,在之前的基础上,作者提出了一种名为DeblurGan-v2的升级网络,该网络的生成器采用特征金字塔模型,能够更准确地定位目标位置帮助细节恢复[2]。
最近,文献[1] 设计了一种基于深度图像先验的神经网络模型,其很好的融合了传统方法训练时间短以及神经网络恢复效果好的优点。通过分别捕捉清晰图像和模糊核的先验信息,并经过神经网络的优化迭代可以迅速地恢复出清晰图像。
6.参考文献
[1] Ren, D., Zhang, K., Wang, Q., Hu, Q., & Zuo, W. (2020). Neural blind deconvolution using deep priors. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 3341-3350).
[2]Kupyn, O., Martyniuk, T., Wu, J., & Wang, Z. (2019). Deblurgan-v2: Deblurring (orders-of-magnitude) faster and better. In Proceedings of the IEEE/CVF international conference on computer vision (pp. 8878-8887).
[3] Shan, Q., Jia, J., & Agarwala, A. (2008). High-quality motion deblurring from a single image. Acm transactions on graphics (tog), 27(3), 1-10.

京公网安备 11011302003690号