转自:上观新闻
近日,在美国召开的2025年IEEE国际计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recognition,CVPR)上,备受瞩目的超可见光谱感知挑战赛结果揭晓:同济大学计算机科学与技术学院赵生捷教授团队在多模态视觉方向的3项核心挑战中以绝对优势荣膺全球第一,实现“大满贯”。
CVPR是全球计算机视觉、模式识别及人工智能领域最具权威性的顶级学术会议之一,与ICCV、ECCV并称“视觉三大顶会”,被学术界与产业界共同视为衡量研究水平的“黄金标准”,甚至被称为计算机视觉领域的“学术奥林匹克”。
此次同济的参赛团队由赵生捷教授与汪昱助理教授联合指导,博士研究生饶季勇、刘宏丽及本科生钟航组成,在与来自斯坦福、MIT、谷歌研究院等全球顶尖院校及科技企业的300余支精英团队的激烈角逐中脱颖而出,其科研成果获大会官方特邀进行主会场汇报,充分彰显了中国高校在多模态智能感知领域的国际领先地位。
“热红外图像超分辨率挑战赛”获奖证书。
本次CVPR“热红外图像超分辨率挑战赛”中,两大技术赛道吸引了全球顶尖科研团队角逐。
其中,赛道1聚焦低分辨率红外图像的8倍超分辨率重建,该任务面临红外信号固有噪声干扰、细节纹理丢失与结构信息模糊等核心挑战。赵生捷教授团队创新性地提出基于Swin Transformer的多阶段图像超分辨率模型,通过多层次、多粒度特征提取和跨尺度特征重建突破了技术瓶颈。在竞赛中展现出显著技术优势,最终以28.52PSNR(峰值信噪比)与0.847SSIM(结构相似性指数)的优异指标斩获赛道冠军。
“热红外图像超分辨率挑战赛”获奖证书。
赛道2聚焦以高分辨率可见光图像为引导,完成低分辨率热图像的8倍与16倍超分辨率重建。针对传统算法在热图像高频细节恢复中存在的纹理模糊、边缘失真等痛点,赵生捷教授团队提出数据混合预训练+多尺度监督的创新技术框架,最终实现了SSIM的最优性能,斩获了该赛道冠军。
“多模态航空视角图像分类挑战赛”获奖证书。
在CVPR“多模态航空视角图像分类挑战赛”的合成孔径雷达图像分类赛道中,赛事要求参赛者基于低分辨率SAR图像完成目标识别任务,并允许借助光学图像(EO)与SAR的配对数据开展跨模态训练。针对SAR图像固有的低分辨率、斑点噪声干扰,以及传统方法难以有效融合多模态信息的痛点,赵生捷教授团队提出“跨传感鲁棒识别网络”,通过构建跨模态领域自适应框架实现技术突破,最终荣膺该赛事冠军。
赵生捷教授团队长期锚定多模态智能感知与视觉推理前沿领域,致力于构建人工智能、大数据分析与计算机视觉技术的深度融合体系。团队聚焦极端环境下的鲁棒感知、多模态数据语义理解与智能决策系统等关键课题,在跨模态特征融合、复杂场景推理及恶劣条件下的感知算法优化等方向形成系统性创新优势。其研究始终围绕“理论突破—技术落地—产业赋能”的闭环逻辑,在自动驾驶环境感知、遥感目标识别、视频理解等领域积累了多项开创性成果。
原标题:《三项全球第一!同济超越斯坦福、MIT等300余支团队,拿下“大满贯”》
栏目主编:徐瑞哲 题图来源:同济大学 图片来源:同济大学
来源:作者:解放日报 李蕾 通讯员 聂阳阳