Code前端首页关于Code前端联系我们

Alpha matting算法研究:前景和背景信息分离、图像去雾

terry 2年前 (2023-09-27) 阅读数 64 #数据结构与算法

1.抠图算法简介

Alpha 抠图算法研究 如何分离图像中的前景信息和背景信息 的问题是剪切。此类问题是数字图像处理和数字图像编辑领域的经典问题,广泛应用于视频编辑和视频分割领域。 Alpha抠图的数学模型是Porter和Duff于1984年提出的

Alpha matting抠图算法研究:前景和背景信息分离、图像去雾

[1]。他首先引入了通道α的概念,即作为前景和背景颜色的线性混合的表示。图像包含前景信息和背景信息。该图像被认为是前景图像和背景图像的合成图像,因此创建了上述混合模型。前景α为1,背景α为0,α的值在0到1之间,表示前景和背景图像的线性组合。在大多数自然图像中,大多数像素属于绝对前景或背景。如何从其他混合点准确估计α值是alpha抠图的关键。

Alpha matting抠图算法研究:前景和背景信息分离、图像去雾

给定输入图像,对于所有像素,(F, B, α) 是未知的,必须进行估计。如果图像是灰度图像,每个像素包含3个未知数,像这个问题是一个欠约束问题。大多数抠图问题都需要用户交互的先验条件,因此我们对已知输入图像的颜色统计量有估计和假设,以便我们可以更准确地估计未知量的值。手动添加的常见限制包括两种类型:Trimap Scribble

预先给出的约束(trimap或streak)越精确,未知区域中的点就越少,前景和背景信息就越容易使用。然而,在实践中,要求预先插入高精度的三元图是一项非常困难、不现实且不必要的任务。如何在预先可用的trimap和最终算法得到的抠图结果之间找到最优解?答案是,不同的抠图算法对这个问题有不同的解释。

2。 Alpha抠图算法开发

通常Alpha抠图算法必须解决两个问题,一是解决图像像素颜色分布模型,二是解决像素颜色与α值的关系。一些经典的抠图算法已经考虑了局部像素颜色分布模型和像素颜色α值模型,然后使用采样(如贝叶斯抠图[2])或传播(例如❀封闭式抠图[3])方法拟合模型并求解α值。其他抠图算法将抠图问题视为半监督学习过程。 ,利用学习方法拟合模型求解α值[4]。在上述方法中,关联像素点取自未指定的像素邻域。除了这种局部抠图算法之外,还有学者提出了基于非局部原理的非局部抠图算法,如 K个最近邻块、全局采样块[6]等深度学习是近几年兴起的,最近最热门的发展方向是基于CNN的编织方法[7][7]。

2003年,庄Y Y等人提出了算法贝叶斯抠图[2]。 Core通过采样域从待定像素的像素域中采样相关像素,利用高斯方向模型定义像素颜色模型,针对图像像素的颜色值特征,采用最大似然估计。 α值。贝叶斯方法从条件概率的角度考虑抠图问题,利用贝叶斯公式建立F、B和α的联合概率分布。抠图问题可以转化为图像的像素I的颜色已知的情况,这样问题就是优化后验概率P(F,B,α|I)并求出近似值F、B 和 α。

2006年,Levin A等人提出闭合编织形式[3]。其核心思想是通过传播方法利用图像的颜色特征,即让α值从已知区域变化传播到未知区域。封闭抠图基于两个假设:首先,颜色分布遵循颜色线性模型;其次,对前景和背景颜色值进行局部平滑,得出未知像素的alpha值与该像素的I颜色是线性相关的,并通过矩阵计算后得到cost的表达式功能被修改。是α的平方形式:

Alpha matting抠图算法研究:前景和背景信息分离、图像去雾

,其中L是拉普拉斯矩阵(消光拉普拉斯矩阵),可以根据图像的局部像素颜色计算。因此,可以以封闭形式求解未指定点的α值,而无需显式估计像素的前景色和背景色。

闭合剪切法提出的拉普拉斯矩阵广泛应用于各种剪切方法中。例如,K近邻抠图(KNN抠图,2012)[5]是通过取特征空间中的k个最近邻点计算拉普拉斯矩阵来计算拉普拉斯矩阵。这种类型的非局部修剪侧重于处理更稀疏的trimap,甚至不需要额外约束的输入,直接通过图像本身的背景和背景策略的差异进行分割。

基于图像局部颜色一致性假设的贝叶斯算法。闭合剪切以线性颜色模型为前提。这两种经典方法都以颜色分布模型为前提。考虑到颜色分布不必遵循一定的规律,2009年,有学者提出了基于学习的抠图算法[4],将抠图问题视为半监督学习问题。更通用的学习方法对应于求解α值的颜色模型,这种算法模型还可以融合除颜色之外的其他图像特征。在之前的抠图算法中,图像特征 只考虑了颜色 。例如,贝叶斯抠图 (2003) 和闭合抠图 (2006) 中使用的图像特征是颜色,K 近邻抠图 (2012) 使用两个特征:HSV 颜色和点像素坐标 ♿ [5]。随着抠图算法的发展,Alonon算法模型融合了其他图像特征。例如,2017年Chao L[9]设计了一个称为SUMD特征的新特征来提高像素识别能力。该特征是纹理特征,其作用是使具有相同纹理的像素具有相同的特征值。

传统的alpha编织方法通常仅使用低级特征,基于深度学习的算法可以考虑更高级别的图像特征,并且可以通过创建大型图像数据集自动优化算法。 2017 年,Xu N 等人。 [7]提出了一种基于深度学习的新抠图算法。使用的CNN模型分为两个阶段:第一阶段是深度卷积编码工具,以原始图像和对应的trimap图像作为输入,从图像中预测α;第二阶段是一个小型卷积神经网络,用于过滤和优化第一个网络的输出。由于CNN网络可以捕获更高的图像结构和语义特征,并且可以在大型数据集上进行优化,因此基于深度学习的抠图方法可以更好地应用于真实图像。

3。除雾公式——图像去雾

图像去雾研究的算法有很多,但主要分为两类,基于图像增强的去雾算法和基于图像恢复的去雾算法。基于图像增强的去雾算法主要通过去除图像中的噪声、增加图像的对比度来恢复清晰无雾的图像。基于图像恢复的去雾算法主要利用雾化图像模型。

2009年,何凯明[14]提出了暗通道去雾算法,应用抠图算法进行图像去雾。暗通道去雾算法是一种基于图像复原的去雾算法,使用雾化图像模型。数学表达式为:

Alpha matting抠图算法研究:前景和背景信息分离、图像去雾

其中I(x)是观测到的雾化图像,J(x)是场景中的真实图像,t(x)是透过率,A是大气光分量。

Alpha matting抠图算法研究:前景和背景信息分离、图像去雾

图像去雾的目的是从I(x)中恢复J(x),A,t(x)。在雾霾图像模型中,虽然大气光成分A是一个未知量,但总体来说,它是一个全局常数,三通道强度值接近255。唯一未知的是散射率t(x)。当拍摄t(x)时,可以很容易地恢复实际图像。 J.雾图像模型

的数学表达式和公式切口是相同的。 J、A和t对应于前景F、背景B和透明通道α。他将成本函数称为闭切[3],并提出了一种去雾算法传输成本函数:

                  E(❀(❀ = t) TLt                                           [3]具有相同的形状,因此可以使用图像平滑方法来优化计算出的传输图t(x)。

使用慢速优化图像去雾传输的计算速度为了解决这个问题,何凯明[15]在2013年提出了一种新的图像滤波方法——引导滤波器,该方法结合封闭算法抠图公式被应用在图像滤波中。

[1] T.达夫,T.波特。合成数字图像[C]//第11届计算机图形学与交互工程年会论文集。 1984:253–259。

[2] Chuang Y Y,Curless B,Salesin D H,等。数字抠图的贝叶斯方法[C] // IEEE 计算机学会计算机视觉和模式识别会议。 2003.

[3]​​​​ Levin A, Lischinski D, Weiss Y. 自然图像抠图的封闭形式解决方案[C]// null. IEEE 计算机学会,2006:61-68。

[4] Cheng Y,Kambhamettu C. 基于学习的数字抠图[C]// 2009 IEEE 第 12 届计算机视觉国际会议(ICCV)。 IEEE 计算机学会,2009.

[5] 陈强,李德,唐中坤. KNN Matting[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35 (9): 2175 -2188.

[6] He K, Rhemann C, Rother C, et al. alpha抠图的全局采样方法[J]. 2011.

[7] Xu N, Price B, Cohen S, et al.艾尔·迪伊p 编织图像[J]. 2017.

[8] He K, Rhemann C, Rother C, et al. alpha抠图的全局采样方法[J]. 2011.

[9] 超丽, 平文, 朱技术研究[D].哈尔滨工业大学,2013.

[11]杨先奎。闭合切口的研究与应用[D].云南大学, 2013.

[12]崔兆华,高立群,马宏斌,李红军.一种改进的alpha-matting算法及其在军事红外目标提取中的应用[J].渤海大学学报(自然科学版),2013,34(02):225-231+95.

[13]​​ Al Y Y B E. N维图像中最优边界和目标区域分割的交互式图切割[J] 。 Iccv, 2001, 1:105-112.

[14] He K, Jiang S, Tang X. 使用先前暗通道的单图像去雾[C] // IEEE 计算机视觉与模式识别会议。 2009.

[15] 何凯, 孙健, 唐霞. 图像过滤指南[J]. IEEE 模式分析与机器智能汇刊,2013,35(6):1397-1409。

版权声明

本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。

热门