【立体匹配论文阅读】Pyramid Stereo Matching Network
创始人
2024-05-30 04:06:00
0

Authors: Jia-Ren Chang, Yong-Sheng Chen
Link: https://arxiv.org/abs/1803.08669
Years: 2018

Credit

请添加图片描述

Novelty and Question set up

本文提出之时,基于深度学习的立体匹配主流方式仍是patch-based孪生结构,这种方式缺乏上下文信息的获取能力,为了解决这个问题,作者提出了PSMnet,主要通过SPP和3D CNN模块来进行上下文信息的学习。其中SPP(空间金字塔池化)结构利用全局多尺度信息来捕获上下文,而3DCNN则是利用多个hourglass结构来实现更优化的cost volume正则。本文主要贡献:
  • 提出一个端对端框架直接获得视差图,并且不需要任何后处理
  • 提出利用SPP来捕获图像上下文信息
  • 提出利用3D Conv的stacked hourglass来进一步获得上下文线索以实现更优的cost volume正则

Solutions and Details

  • 总体结构
    请添加图片描述

    整体网络结构分4个stage:

    1. CNN:用于提取图像特征,PSMNet在最末几个block采用了dilation来扩大感受野
      请添加图片描述
    2. SPP:用于聚合上下文信息
      请添加图片描述
    3. Cost Volume:构建左右图特征的匹配代价,采用特征concatenate策略
      请添加图片描述
    4. Regularization:采用3个hourglass对代价体进行正则化,每个hourglass block都会输出一个预测视差图,训练阶段会对三个视差图进行加权平均,而推理时只采用最后一层输出的视差图
      请添加图片描述
  • 视差回归

    沿用GC-Net的soft argmin策略,对所有视差level进行一个可差分的回归估计

    d^=∑d=0Dmaxd×σ(−cd)\hat{d} = \sum_{d=0}^{D_{max}}d\times{\sigma{(-c_{d}})} d^=d=0∑Dmax​​d×σ(−cd​)

  • 损失函数

    采用SmoothL1作为损失函数,对ground truth视差图和预测视差计算平均误差

    L(d,d^)=1N∑i=1NsmoothL1(di−d^i)L(d,\hat{d})=\frac{1}{N}\sum_{i=1}^{N}smooth_{L1}(d_i-\hat{d}_i) L(d,d^)=N1​i=1∑N​smoothL1​(di​−d^i​)

Results

  • 在Sceneflow和KITTI-2012/2015上进行实验,最大视差设置为192,对于KITTI数据集,由于数据量太少,采用在Sceneflow上预训练的模型进行finetune请添加图片描述
  • 在KITTI和Sceneflow上进行消融实验,验证dliated conv、SPP、stacked hourglass对精度的影响,结果显示三者都用对精度提升帮助比较大;另外在KITTI上进行loss的权重选取对比,0.5\0.7\1.0的组合效果最佳请添加图片描述
  • 在KITTI2015上与其他SOTA的表现对比,除了前景区域,其余精度指标上表现都比其他SOTA要好请添加图片描述
  • 在Sceneflow数据集上与其他SOTA比较,EPE指标上明显好于其他模型,比GC-Net误差明显要低很多请添加图片描述
  • 在KITTI2012上与其他模型比较,所有指标均达到SOTA水平
    请添加图片描述

Thoughts

  • PSMNet采用SPP,不仅突破了模型对分辨率,也增强了立体匹配必需的上下文信息聚合的能力
  • 采用stacked hourglass增强了代价正则的效果,但因为用了3D卷积,这个stage算力要求非常高,并且stacked hourglass会产生大量的feature map缓存,内存开销也不小
  • PSMNet的创新点基本都在模型结构上,范式基本还是沿用GC-Net,其他方面没有太多亮点

相关内容

热门资讯

中国—乌兹别克斯坦职业教育合作... 中国教育报-中国教育新闻网讯(记者 杨国良)近日,由重庆工程职业技术学院主办的中国—乌兹别克斯坦职业...
飞天诚信:董事、副总经理计划减... 格隆汇6月16日|飞天诚信(300386.SZ)公告称,公司持股11.26%的股东、董事、副总经理李...
甘肃能源:民勤100万千瓦风光... 本报讯 (记者刘欢)6月16日晚间,甘肃电投能源发展股份有限公司发布公告称,近日,公司收到甘肃电投民...
中电鑫龙:董事计划减持不超过6... 每经AI快讯,6月16日,中电鑫龙(002298.SZ)公告称,公司董事束龙胜因个人资金需求,计划在...
以色列总理威胁德黑兰市民“立即... 转自:CCTV国际时讯以色列总理内塔尼亚胡今天(6月16日)发表声明称,以色列空军已掌控德黑兰领空,...
山河药辅:复星医药减持计划实施... 2025年2月24日,安徽山河药用辅料股份有限公司(以下简称“山河药辅”)发布《关于5%以上股东减持...
IPO鹰眼预警|新恒汇上市触发... Hehson财经上市公司研究院|财报鹰眼预警新恒汇电子股份有限公司(以下简称“新恒汇”)拟计划在深圳...
“银联会议”App骗局:一通来...   “接了个会议电话,手机银行App里面的存款就被诈骗分子转走了。”近日,家住北京的受害者常燕(化名...
A股三指齐升!成份股狂掀涨停潮...   A股三大指数今日(6月16日)集体收涨,截至收盘,沪指涨0.35%,深证成指涨0.41%,创业板...
医院 “健身房”走红 个性化“... 6月16日,在四川省骨科医院运动医学科的治疗室内,康复师正依据个性化“运动处方”指导患者训练。这里既...
歼-10CE,到巴黎了 当地时间6月16日,第55届巴黎-布尔歇国际航空航天展览会(以下简称“巴黎航展”)在法国巴黎正式拉开...
一中支领“百万罚单”,紫金保险... 转自:北京商报保险业再现大额罚单。6月16日,北京商报记者了解到,紫金财产保险股份有限公司洛阳中心支...
【环球财经】新加坡海峡时报指数... 转自:新华财经新华财经新加坡6月16日电(记者刘春涛)新加坡海峡时报指数16日跌0.08%,收于39...
MS CONCEPT(0844... MS CONCEPT(08447)发布公告,公司全资附属公司Lord Restaurant(作为租户...
力合科技股东国科瑞华拟减持55... 力合科技(湖南)股份有限公司于近日发布了关于股东减持股份的预披露公告。公告显示,股东国科瑞华创业投资...
新华时评·民生无小事|严肃整治... 转自:新华社新华社南宁6月16日电  题:严肃整治学生用品采购环节乱象新华社记者陈一帆以方便教学为名...
“中国正考虑解除对英国议员制裁... 中国外交部发言人郭嘉昆16日主持例行记者会。有记者提问:据英国《卫报》报道,两名英国政府消息人士透露...
黄石博仕肛肠医院过度医疗追踪:... 125份抽查病例中,113份存在过度医疗行为;就诊患者手术率超90%,远超当地平均水平……翻开卫健部...
能源和科技巨头齐聚华盛顿 讨论... 格隆汇6月16日|据AXIOS网站,今天,来自石油巨头、科技和电力巨头以及金融巨头的高管们将在华盛顿...
隆平高科第一期员工持股计划第三... 6月16日,隆平高科(000998)发布公告,关于长期服务计划之第一期员工持股计划的第三个锁定期于2...