关于图像抠图算法,Levin等人在2007年基于图像的局部光滑假设,利用代数的方法推导出了alpha matte矩阵闭合解的形式。原文名称是”A Closed Form Solution to Natural Image Matting”。
在抠图问题中,假设第i个像素点的值 Ii I i 是由前景点 Fi F i 和背景点 Bi B i 按下式加权合成的:
不同的抠图系统所接受的用户输入一般有两种形式——trimap或scribbles。两种方式的目的都是要给出alpha matte矩阵的初始估计。trimap的方式需要用户指出所有的混合像素点,哪怕以掺入大量的前景点和背景点为代价,如(a)所示;而scribbles的方法只需用户在确定的前景和背景区域分别画出一些条状区域即可,如下图(b)所示,在转化成alpha matte矩阵时,α的值同样也是前景处为1,背景处为0,scribble的交互方式显然比trimap的方式要简单,尤其当对于图像前景轮廓比较复杂的时候。
为了使式1可以被求解,必须对F和B施加一些假设,该算法即假定F和B是局部光滑的,也就是在一个小的图像窗口w中(如3x3),F和B固定不变,那么式(1)就可以写成:
如果是rgb图,因为有了3个通道,所以需要对每个通道重复上述过程,但原文却采取了另外一种假设模型——color line model。与灰度图的局部光滑假设不同,color line 模型假定子窗口内的前景和背景像素值不是固定的,而是位于一条直线上:
将此假设带入到式1中,经过推导(原文中给出了证明),可以得到彩色图像的线性模型:
ac a c 和b是仅与F,B,I有关的变量。将式5带入灰度图像的推导过程,同样可以将目标函数化简成式4,只是L略有不同:
此时 ∑k ∑ k 变成了窗口内所有像素的协方差矩阵, uk u k 是三维列向量,分别对应三个通道的像素均值, I3 I 3 是3x3的单位阵。L又被称为matting laplace矩阵。
施加了像素分布的假设后,还需要考虑用户指定的前景和背景的先验分布。当用户按图(b)的方式在原始图像上画出一系列区域时,α中相应像素点被赋值1(前景)或0(背景),那么式4的优化问题就变成了:
S是用户所指定的像素点的集合, si s i 取0或1。
为求解式5,首先对L中的像素位置进行重组,再次强调之前所说的,L是对称矩阵:
LM L M 是已知像素点的集合, LU L U 是未知像素点的集合,也就是将图像中所有标记出的像素排在前面,要求解的未知像素排在后面,当然为保证变换前后等式关系一致,α也需要相应调整:
带入式4:
要求J(α)的最小值,需要进行矩阵求导,矩阵求导的通用公式如下:
因为 αM α M 已知,所以上式中的第一项导数为0:
LU L U 是对称的,所以最后求出的解为:
原图和用户输入的scribble图如下:
程序输出的结果如下:
可以看出,尽管该算法比较简单,但即使是与一些采用繁复的迭代的算法相比,其效果也是不错的。
当然,最终结果的好坏还是取决于两个因素——图像是否满足color line model的假设以及用户输入的先验信息,据原文的说法,一般的自然图像都可以较好的满足color line model。
转载地址:
本文发布于:2024-01-31 13:24:25,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170667866428844.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |