【立体匹配论文阅读】Pyramid Stereo Matching Network
创始人
2024-05-30 04:06:00
0

Authors: Jia-Ren Chang, Yong-Sheng Chen
Link: https://arxiv.org/abs/1803.08669
Years: 2018

Credit

请添加图片描述

Novelty and Question set up

本文提出之时,基于深度学习的立体匹配主流方式仍是patch-based孪生结构,这种方式缺乏上下文信息的获取能力,为了解决这个问题,作者提出了PSMnet,主要通过SPP和3D CNN模块来进行上下文信息的学习。其中SPP(空间金字塔池化)结构利用全局多尺度信息来捕获上下文,而3DCNN则是利用多个hourglass结构来实现更优化的cost volume正则。本文主要贡献:
  • 提出一个端对端框架直接获得视差图,并且不需要任何后处理
  • 提出利用SPP来捕获图像上下文信息
  • 提出利用3D Conv的stacked hourglass来进一步获得上下文线索以实现更优的cost volume正则

Solutions and Details

  • 总体结构
    请添加图片描述

    整体网络结构分4个stage:

    1. CNN:用于提取图像特征,PSMNet在最末几个block采用了dilation来扩大感受野
      请添加图片描述
    2. SPP:用于聚合上下文信息
      请添加图片描述
    3. Cost Volume:构建左右图特征的匹配代价,采用特征concatenate策略
      请添加图片描述
    4. Regularization:采用3个hourglass对代价体进行正则化,每个hourglass block都会输出一个预测视差图,训练阶段会对三个视差图进行加权平均,而推理时只采用最后一层输出的视差图
      请添加图片描述
  • 视差回归

    沿用GC-Net的soft argmin策略,对所有视差level进行一个可差分的回归估计

    d^=∑d=0Dmaxd×σ(−cd)\hat{d} = \sum_{d=0}^{D_{max}}d\times{\sigma{(-c_{d}})} d^=d=0∑Dmax​​d×σ(−cd​)

  • 损失函数

    采用SmoothL1作为损失函数,对ground truth视差图和预测视差计算平均误差

    L(d,d^)=1N∑i=1NsmoothL1(di−d^i)L(d,\hat{d})=\frac{1}{N}\sum_{i=1}^{N}smooth_{L1}(d_i-\hat{d}_i) L(d,d^)=N1​i=1∑N​smoothL1​(di​−d^i​)

Results

  • 在Sceneflow和KITTI-2012/2015上进行实验,最大视差设置为192,对于KITTI数据集,由于数据量太少,采用在Sceneflow上预训练的模型进行finetune请添加图片描述
  • 在KITTI和Sceneflow上进行消融实验,验证dliated conv、SPP、stacked hourglass对精度的影响,结果显示三者都用对精度提升帮助比较大;另外在KITTI上进行loss的权重选取对比,0.5\0.7\1.0的组合效果最佳请添加图片描述
  • 在KITTI2015上与其他SOTA的表现对比,除了前景区域,其余精度指标上表现都比其他SOTA要好请添加图片描述
  • 在Sceneflow数据集上与其他SOTA比较,EPE指标上明显好于其他模型,比GC-Net误差明显要低很多请添加图片描述
  • 在KITTI2012上与其他模型比较,所有指标均达到SOTA水平
    请添加图片描述

Thoughts

  • PSMNet采用SPP,不仅突破了模型对分辨率,也增强了立体匹配必需的上下文信息聚合的能力
  • 采用stacked hourglass增强了代价正则的效果,但因为用了3D卷积,这个stage算力要求非常高,并且stacked hourglass会产生大量的feature map缓存,内存开销也不小
  • PSMNet的创新点基本都在模型结构上,范式基本还是沿用GC-Net,其他方面没有太多亮点

相关内容

热门资讯

与龙共舞的曲目列表 与龙共舞的曲目列表01 The Dragon´s Legend(Medley)02 Br...
孩子得了一种病毒,看他这样我也... 孩子得了一种病毒,看他这样我也很痛苦自从生下地第二天孩子就做院了,刚开始只是起了一片红的,还以是烫着...
带头盔的一个卡通人物叫什么? 带头盔的一个卡通人物叫什么?带头盔的一个卡通人物叫什么? 目前最新的……应该就是无头骑士异闻录了吧!...
小主播如何月入过万 小主播如何月入过万
地矿局野外工作艰苦吗 地矿局野外工作艰苦吗地矿局野外工作比较艰苦的,他们要扛着相关测量探测仪器,到野外探测矿藏,挖样块,做...
没离婚老婆不管孩子怎么办,老婆... 没离婚老婆不管孩子怎么办,老婆离家出走不管孩子我该咋办?可以诉讼。老婆离家出走不管孩子,可以向法院提...
阴历中的润月有的是润五月有的是... 阴历中的润月有的是润五月有的是润九月是怎么回事这润月是怎样算的呀还有这为什么有润月哟求解答三年一润,...
歌曲经典老歌 歌曲经典老歌歌曲经典老歌有:《斯卡薯郑罩布罗集市》、《AuldLangSyne》、《Yesterda...
怎样找到自己的梦想 怎样找到自己的梦想首先要给自己定一个小目标一点去奋斗,当在奋斗中就能获得自己的梦想梦想是什么?俗话都...
吉利星瑞的油耗怎么样? 吉利星瑞的油耗怎么样?吉利星瑞的油耗怎么样?估测实际油耗多少?不可能6.7L油,平均油耗最低要8个油...
佛山什么建筑最高? 佛山什么建筑最高?罗浮宫国际家居总部大厦最高。罗浮宫国际家居总部大厦位于佛山乐从,总高度为236.0...
怎么写未来一个月的活动计划? 怎么写未来一个月的活动计划?如果你是一个学校的学习部部长,为了提高学校的学习气氛的一些活动,你要怎样...
背起我的行囊走在那老路上。这首... 背起我的行囊走在那老路上。这首歌叫什么名字?这首歌曲叫:流浪兄弟
九十年代的一部武打电视剧有一个... 九十年代的一部武打电视剧有一个称为白衣人的出手就让对方眉心中剑的叫什么名字九十年代的一部武打电视剧有...
给我讲五个幽默笑话? 给我讲五个幽默笑话?幽默笑话幽默笑话幽默笑话幽默笑话幽默笑话
穷人与富人的差别只有一个字不是... 穷人与富人的差别只有一个字不是吗?同样的有钱没钱都是人!有钱没钱都是人,但不能随意、堕落啊
金色琴弦 12话具体内容 金色琴弦 12话具体内容那个因为时间不够来不及看完,只好来求助一下对柚木突然的暴变,香穗子无法隐藏内...
内心自卑敏感的人,适合学习心理... 内心自卑敏感的人,适合学习心理学吗是可以的,学习心理是自我成长的过程,不过要改善这个过程,还是通过系...
求和光之子类似的小说 求和光之子类似的小说主角要坚强,能拼,是魔法师,也有元素云云,不是现代太多了~~~~~主角要坚强,能...
男生对女生说想吃你是什么意思? 男生对女生说想吃你是什么意思?这是我男朋友对我这么说的,因为我是初恋,经验不足,想请教各位哥哥姐姐是...