科研动态 | 我院本科生在高分辨率卫星三维测绘方面取得的研究成果发表于国际学术期刊
研究背景
基于高分辨率卫星影像的密集匹配是摄影测量与遥感中的一项基础而具有挑战性的任务。其目标是从极线校正后的立体影像中估计逐像素视差并生成视差图,是三维地物重建的关键步骤之一。高分辨率卫星影像相较于近景图像包含更复杂的地表结构信息,存在更严重的弱纹理、重复纹理以及视差不连续区域,上述因素共同造成了卫星影像密集匹配的挑战性。
近年来深度学习技术凭借强大的特征提取能力,已广泛应用于密集匹配任务中,然而,现有的端到端网络在代价聚合阶段易受到冗余信息的干扰,在困难区域的匹配精度较低。为此,本文针对代价空间冗余问题,通过优化代价聚合过程和对代价体的分块处理策略,设计了多尺度分块注意力网络(MSCA-Net),有效提高困难区域下的视差估计精度。
研究内容
本研究以代价空间冗余为切入点,重点针对代价聚合环节设计了基于代价体正则化约束的多尺度分块注意力网络(MSCA-Net)。网络首先利用金字塔特征构建多尺度代价体,在代价聚合阶段,通过所设计的分级空间聚合模块(HSA)动态捕获代价体不同层级的信息,实现对重复纹理精细结构与弱纹理区域全局语义的准确感知,完成初步正则化。之后,基于设计的分块注意力沙漏模块(CAH)通过对代价体的多维切割,对子代价体独立正则化,准确捕捉视差不连续区域局部细节,抑制冗余信息干扰,基于上述流程的协同作用有效提升一众难处理区域的匹配精度。

图1 MSCA-Net模型架构图
为了充分评估MSCA-Net在密集匹配任务的表现,本研究在已有的两套公开数据集Urban Semantic 3D(US3D)与WHU-Stereo进行了充分的实验对比,包括经典的传统算法SGM、Ground View和专门基于卫星影像设计的深度学习方法。
研究结果
实验结果表明,所提出的MSCA-Net在两套数据集上均展现出明显优势,与现有的一系列经典及先进方法相比,定量指标EPE与D1%有显著提升,在重复纹理、弱纹理、视差不连续等典型挑战区域,MSCA-Net展现出卓越的立体匹配性能,这得益于分级空间聚合(HSA)模块对多尺度信息及多维特性的充分利用,以及分块注意力沙漏(CAH)模块对代价体的细粒度正则化。

图2 不同方法在两套数据集上的定量精度评价结果
总体而言,MSCA-Net通过对代价体的多维特性和对同一代价空间内的多尺度信息的充分利用有效提升了难处理区域的视差估计精度,此外对高维张量的细粒度多维解耦的核心思想也为未来的研究提供了一个有价值的方向,它为构建更具适应性和通用性的代价聚合机制提供了指导,为卫星立体像对的密集匹配任务提供了创新性的解决方案。

图3 不同方法在WHU-Stereo数据集上的视差图结果
发表信息
研究成果于2025年10月在《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》上发表,论文题目为MSCA-Net: Multiscale Chunked Attention Network for High-Resolution Satellite Stereo Matching。中山大学遥感科学与技术学院22级本科生王怡潇为第一作者,22级本科生温珍权为第二作者,黄旭副教授为通讯作者。本研究受中山大学中央高校基本科研业务费专项资金(24xkjc002)资助。
原文链接: https://ieeexplore.ieee.org/document/11204808?source=authoraler
