论文
传统的方法和大多数现有的工作利用了额外的输入,如三分图(ST-FAM那个),背景图像(BGM-V2),来预测alpha图。但提供额外的输入并不总是可行的,而且模型对这些额外的输入过于敏感。
本文使用一种无额外输入且使用GAN的方法进行人像抠图。分为两个网络:一个分割网络用于生成粗略的人物分割mask和一个alpha生成网络用于alpha图预测。
该方法优于同样采用单一输入的MODNet方法。同时获得了与需要额外输入的BGM-V2和FBA方法相当的结果。
生成器网络:编码器,解码器以及残差块和ASPP模块。
鉴别器网络:使用原始图像和下采样2倍和4倍的图像组成图像金字塔,以获得相同图像的不同比例。
损失函数:
segmentation loss和compositional loss的组合如公式如下图所示:
得到腐蚀分割图(a)和膨胀分割图(b)。然后相减得到边界分割图(d)。
生成器网络:一个编码器负责编码输入图像以获得其特征图。另一个编码器负责编码由分割网络产生的粗略分割图以获得其特征图;将两个编码器的输出相连,concat之后经过残差模块;最后经过解码器上采样输出最终的alpha图。其中skip-connection促使网络保留来自两个编码器的信息。
鉴别器网络:同分割网络。
损失函数:
adversarial loss:同分割网络(分割图替换为alpha图)
perceptual loss :同分割网络(分割图替换为alpha图)
alpha loss:
border loss:
输入图像:1280 × 768
生成器学习率:10-4
鉴别器学习率:10-5
batch size:2
优化器:Adam
训练集:(AIM的201张+D646的363张)*COCO100张
测试集:(AIM的11张+PM85的85张+D646的11张)*VOC20张
本文发布于:2024-01-31 13:25:27,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170667873028847.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |