近日,澳门美高梅金殿计算机工程学院多模态智能感知与交互技术团队主要成员俞翔副教授在图像遥感研究领域取得新进展,相关研究论文EMC2A-Net: An Efficient Multibranch Cross-channel Attention Network for SAR Target Classification被遥感与地球科学领域国际权威期刊《IEEE Transactions on Geoscience and Remote Sensing(IEEE TGRS)》正式录用,俞翔副教授为论文第一作者和通讯作者,计算机工程学院钱瑛讲师、黄晓华教授及本科生王青禄为共同作者,南京工程学院为第一署名单位。IEEE TGRS是地球科学和遥感领域的顶级期刊之一,在遥感技术和地球科学领域具有非常高的影响力。
SAR(Synthetic Aperture Radar,合成孔径雷达)是一种主动雷达技术,利用射频信号来获取地面目标的高分辨率图像。与光学遥感不同,SAR可以在任何天气条件下、任何时间进行观测,并且对地形和目标结构的细节具有很高的穿透力。这使得SAR成为了许多领域的重要工具,如军事侦察、环境监测、灾害管理和资源勘探等。在SAR图像中,目标识别是一个关键的研究问题。目标识别指的是对人造目标的SAR图像进行分类,例如不同型号的车辆、火炮和舰船等。然而,由于SAR图像具有特殊的特性,如多径效应、相干斑噪声和复杂的散射机制等,使得该目标识别问题更具挑战性。
SAR目标识别的研究对于充分发挥SAR技术的优势、满足多领域应用需求、实现数据处理自动化以及提高目标识别的准确性和稳健性具有非常重要的意义。该文针对SAR目标识别问题,首先,提出了两个残差模块,称为EMC2A模块,其具有基于多分支结构的多尺度感受野,该模块采用具有不同空洞率的并行空洞卷积来有效地捕获多尺度上下文特征,而不会显著增加计算量。其次,该文基于EMC2A模块提出了一种有效的同质化结构深度卷积神经网络,称为EMC2A-Net。最后,为了进一步提高多尺度特征融合的效率,该文提出了一种多尺度特征跨通道注意力模块,该模块采用了不降维的局部多尺度特征交互策略,并引导全局通道的注意力。在MSTAR数据集上的实验结果表明,EMC2A-Net识别准确率均优于其他SOTA模型,并具有相对轻量化的网络结构。
这项研究解决了传统卷积神经网络模型在SAR目标识别中的局限性,并提出了一种全新的基于通道注意力机制的网络基础结构。基于该结构的创新性设计,得到了一种SAR目标识别网络模型,该模型具有概率和数理统计意义上的可解释性,并展现出优秀的性能和鲁棒性。该成果丰富了SAR目标识别技术,同时也挖掘了深度学习在该领域中的应用潜力。
文章信息:Xiang Yu, Ying Qian, Zhe Geng, Xiaohua Huang, Qinglu Wang and Daiyin Zhu. “EMC2A-Net: An Efficient Multibranch Cross-channel Attention Network for SAR Target Classification”,IEEE Transactions on Geoscience and Remote Sensing, 2023(DOI: 10.1109/TGRS.2023.3285037).