光照不足的样例
如上所述,我们在 Jeremy Howard 的课程中进修到了 Tiramisu 模型。固然它的全名 “100 层 Tiramisu” 可能暗示了它是一个巨大年夜的模型,但事实上它异常地经济,甚至只有 900 万个参数,而 VGG16 则拥有跨越 1.3 亿个参数。
将来
进一步练习
我们的练习数据练习了 300 多个时代,在这之后,模型开端变得过拟合。因为我们的结不雅已经异常接近于宣布的成就,是以我们没有机会应用数据加强的根本做法。
经由一番实验,我们决定精简数据集。起首,我们选出了那些包含有人物的图像,如许的图像有 4 万张。然后,我们持续将那些包含有太多人物的图像剔除,残剩的图片中只包含有 1 到 2 小我,因为如许的图像与我们的产品目标最契合。最终,我们只留下那些图中有 20%~70% 的区域被标记为人的图像,而持续移除了那些背景中人物过小,或者是存在某些怪异器械的图片。最终,精简后的数据集包含有 1.1 万张图像,而我们认为这个数据量在现阶段已经足够了。
练习所用的输入图像同一被调剂为 224*224 大年夜小。更进一步地,采取更多的数据和更大年夜分辨率的图像(COCO 图像的原始大年夜小约为 600*1000)进行练习模型也对进步最终的结不雅有赞助。
CRF 和其它加强
在某些阶段,我们发明有些结不雅的边沿存在噪点。可以采取 CRF 模型来改良这一问题。在这个博客中,作者展示了 CRF 的简单使悠揭捉?例。
然则该办法对我们的工作来说还不是很有赞助,也许是因为只有当结不雅比较粗拙的时刻该办法才会有所赞助。
抠图(Matting)
即使我们今朝取得了如许的结不雅,然则在实际的瓜分中照样不敷完美。诸如头发、细腻的衣服、树枝和其它精细的物品永远无法被完美瓜分。事实上,这种异常精细的瓜分义务被称为抠图(Matting),它定义了一种不合的挑衅。这里展示了一个当缁ゎ先辈的抠图样例,该项工作是在本年早些时刻的 NVIDIA 大年夜会上揭橥的。
抠图样例,输入包含了 Trimap
抠图义务与其它图像相干的义务不太一样,因为它的输入中不仅有原始图像还有三分图(Trimap)。三分图指的是图像边沿的轮廓,这也使得它成了 “半监督” 问题。
我们应用抠图进行了一些实验,就是将我们的瓜分图像作为三分图应用,然则却没有取得任何有意义的结不雅。
还有一个问题就是缺乏应用的练习数据集。
总结
事实证实,要在研究和测验测验新事物以及练习和改进模型之间取得均衡是一件不轻易的工作。因为应用了深度进修,我们老是认为最好的模型或者最合适我们的模型就躲在某个角落,只须要多进行一次 Google 搜刮或者多浏览一篇论文就将会引导我们发明它。然则在实践中,我们实际的改进来自于大年夜原始的模型一一点点地 “挤压”。并且如上所述,我们仍然认为有更多的处所可以持续改进。
【编辑推荐】
- 为什么大年夜家都不戳破深度进修的本质?!
- 除了深度进修,你还应当懂得这些成长偏向
- 深度进修,若何用去噪自编码器猜测原始数据?
- PaddlePaddle深度进修开源婢歙 :等待世人划桨的中国AI大年夜船
- 当下,应抓紧摸索超出深度进修的其他实现办法
推荐阅读
【限时免费】岁尾最强一次云计算大年夜会,看传统、社区、互联网企业若何碰撞? 1、开源库Web 范畴:Sanichttps://github.com/channelcat/sanic这个库的名字和之前一个很火的梗有关,有人在>>>详细阅读
本文标题:详解如何用深度学习消除背景,实现抠图
地址:http://www.17bianji.com/lsqh/40214.html
1/2 1