【立体匹配论文阅读】Pyramid Stereo Matching Network
创始人
2024-05-30 04:06:00
0

Authors: Jia-Ren Chang, Yong-Sheng Chen
Link: https://arxiv.org/abs/1803.08669
Years: 2018

Credit

请添加图片描述

Novelty and Question set up

本文提出之时,基于深度学习的立体匹配主流方式仍是patch-based孪生结构,这种方式缺乏上下文信息的获取能力,为了解决这个问题,作者提出了PSMnet,主要通过SPP和3D CNN模块来进行上下文信息的学习。其中SPP(空间金字塔池化)结构利用全局多尺度信息来捕获上下文,而3DCNN则是利用多个hourglass结构来实现更优化的cost volume正则。本文主要贡献:
  • 提出一个端对端框架直接获得视差图,并且不需要任何后处理
  • 提出利用SPP来捕获图像上下文信息
  • 提出利用3D Conv的stacked hourglass来进一步获得上下文线索以实现更优的cost volume正则

Solutions and Details

  • 总体结构
    请添加图片描述

    整体网络结构分4个stage:

    1. CNN:用于提取图像特征,PSMNet在最末几个block采用了dilation来扩大感受野
      请添加图片描述
    2. SPP:用于聚合上下文信息
      请添加图片描述
    3. Cost Volume:构建左右图特征的匹配代价,采用特征concatenate策略
      请添加图片描述
    4. Regularization:采用3个hourglass对代价体进行正则化,每个hourglass block都会输出一个预测视差图,训练阶段会对三个视差图进行加权平均,而推理时只采用最后一层输出的视差图
      请添加图片描述
  • 视差回归

    沿用GC-Net的soft argmin策略,对所有视差level进行一个可差分的回归估计

    d^=∑d=0Dmaxd×σ(−cd)\hat{d} = \sum_{d=0}^{D_{max}}d\times{\sigma{(-c_{d}})} d^=d=0∑Dmax​​d×σ(−cd​)

  • 损失函数

    采用SmoothL1作为损失函数,对ground truth视差图和预测视差计算平均误差

    L(d,d^)=1N∑i=1NsmoothL1(di−d^i)L(d,\hat{d})=\frac{1}{N}\sum_{i=1}^{N}smooth_{L1}(d_i-\hat{d}_i) L(d,d^)=N1​i=1∑N​smoothL1​(di​−d^i​)

Results

  • 在Sceneflow和KITTI-2012/2015上进行实验,最大视差设置为192,对于KITTI数据集,由于数据量太少,采用在Sceneflow上预训练的模型进行finetune请添加图片描述
  • 在KITTI和Sceneflow上进行消融实验,验证dliated conv、SPP、stacked hourglass对精度的影响,结果显示三者都用对精度提升帮助比较大;另外在KITTI上进行loss的权重选取对比,0.5\0.7\1.0的组合效果最佳请添加图片描述
  • 在KITTI2015上与其他SOTA的表现对比,除了前景区域,其余精度指标上表现都比其他SOTA要好请添加图片描述
  • 在Sceneflow数据集上与其他SOTA比较,EPE指标上明显好于其他模型,比GC-Net误差明显要低很多请添加图片描述
  • 在KITTI2012上与其他模型比较,所有指标均达到SOTA水平
    请添加图片描述

Thoughts

  • PSMNet采用SPP,不仅突破了模型对分辨率,也增强了立体匹配必需的上下文信息聚合的能力
  • 采用stacked hourglass增强了代价正则的效果,但因为用了3D卷积,这个stage算力要求非常高,并且stacked hourglass会产生大量的feature map缓存,内存开销也不小
  • PSMNet的创新点基本都在模型结构上,范式基本还是沿用GC-Net,其他方面没有太多亮点

相关内容

热门资讯

女人是怎样上厕所的 女人是怎样上厕所的 ,,,当然是蹲着了,不管大小都要带纸,明白了么,呵
简述游戏对儿童认知发展的作用是... 简述游戏对儿童认知发展的作用是什么?简述游戏对儿童认知发展的作用是什么? 游戏能有效地促进幼儿认知、...
离别的诗小学 离别的诗小学1、直道相思了无益,未妨惆怅是清狂。2、执手相看泪眼,竟无语凝噎。3、曾经沧海难为水,除...
《女神异闻录5》结局是什么? 《女神异闻录5》结局是什么? 《女神异闻录5》结局是永不落幕。莲被报道作为怪盗团事件的嫌疑犯而自杀的...
为什么会有戚顾同人的? 为什么会有戚顾同人的?为什么会有戚顾同人的??逆水寒为什么会有戚顾王道??是不是本身剧情就存在暧昧?...
关于篮球的词语 关于篮球的词语篮板、得分 、断球、发球形容篮球的词语比较常见的有雷霆万钧 千钧一发 球迷: 万众一心...
迈康立接骨木莓的食用方法? 迈康立接骨木莓的食用方法?食用方法可自主选择。关键是注意温度不要过高,这样容易破坏营养成分活性。以下...
求音乐:如果奥特曼打不赢小怪兽 求音乐:如果奥特曼打不赢小怪兽歌名应为 万一奥特曼打不赢小怪兽 歌手:小贱 专辑:我是小贱
数学动物园主要内容 数学动物园主要内容18算数有关的故事,里面的人物有小熊、小猴、老山羊、狐狸、黄鼠狼、虎大王、蛇和小灰...
请问有否可能超越光速?如果超越... 请问有否可能超越光速?如果超越了光速会后破坏物理规则。理论上可以 但是现在做不到 不会破坏物理...
心里总是很压抑,好想发泄一下,... 心里总是很压抑,好想发泄一下,但不知道该怎么去发泄,有没有好的建议啊?跳水,蹦机做一些挑战自己的运动
有关纪晓岚的长而幽默故事 有关纪晓岚的长而幽默故事拥抱 著名法国幽默作家特里斯坦·贝尔纳有一天去一家饭馆吃饭,对那里的服务态度...
道教的天仙和地仙,究竟有什么分... 道教的天仙和地仙,究竟有什么分别?道教的天仙和地仙,主要是办公的地方不一样,一个在天上,一个在地上道...
在你眼中感情的深浅和认识的时间... 在你眼中感情的深浅和认识的时间长短有关系吗?很有关系,所谓的路遥知马力,日久见人心,认识时间短,对对...
让孩子学习钢琴是为了让孩子学成... 让孩子学习钢琴是为了让孩子学成钢琴家吗小孩子对形状各异、能发出不同音色的乐器远不就充满了好奇心的,乐...
惊恐发作的我...好害怕 惊恐发作的我...好害怕心理分析:您好,癫痫(epilepsy)即俗称的“羊角风”或“羊癫风”,是大...
什么是经络按摩 什么是经络按摩你好,经络按摩就是从中医的经络走行,来针对治疗疾病而进行按摩达到治疗或辅助的功能。
求本伪兄妹小说,女主其实是男主... 求本伪兄妹小说,女主其实是男主的妈妈,男主和他的好朋友都爱上了女求本伪兄妹小说,女主其实是男主的妈妈...
舞动精灵乐团中好听的歌曲有那些... 舞动精灵乐团中好听的歌曲有那些?SHEGOD IS GIRLFar away from my hom...
《盗梦空间》里面柯布是如何迷失... 《盗梦空间》里面柯布是如何迷失在最后一层梦境的?这个是斋藤建造的梦,所以自然情况比较危险,没有办法很...