电子学报 ›› 2021, Vol. 49 ›› Issue (4): 679-689.DOI: 10.12263/DZXB.20200554

• 学术论文 • 上一篇    下一篇

基于弱语义注意力的遥感图像可解释目标检测

周勇1,2, 陈思霖1,2, 赵佳琦1,2,3, 张迪1,2, 王瀚正1,2   

  1. 1. 中国矿业大学计算机科学与技术学院, 江苏徐州 221116;
    2. 矿山数字化教育部工程研究中心, 江苏徐州 221116;
    3. 灾害智能防控与应急救援创新研究中心, 江苏徐州 221116
  • 收稿日期:2020-06-10 修回日期:2020-12-11 出版日期:2021-04-25 发布日期:2021-04-25
  • 作者简介:周勇 男,1974年9月出生于江苏省徐州市,中国矿业大学计算机科学与技术学院教授.主要研究方向为数据挖掘、机器学习和人工智能.E-mail:yzhou@cumt.edu.cn;陈思霖 男,1998年4月出生于吉林省吉林市,中国矿业大学计算机科学与技术学院硕士研究生.主要研究方向为计算机视觉、图像处理、目标检测.E-mail:silin.chen@cumt.edu.cn
  • 基金资助:
    国家自然科学基金(No.61806206);江苏省自然科学基金(No.BK20180639,No.BK20201346);江苏省六大高峰人才项目(No.2015-DZXX-010)

Weakly Semantic Based Attention Network for Interpretable Object Detection in Remote Sensing Imagery

ZHOU Yong1,2, CHEN Si-lin1,2, ZHAO Jia-qi1,2,3, ZHANG Di1,2, WANG Han-zheng1,2   

  1. 1. School of Computer Science and Technology, China University of Mining and Technology, Xuzhou, Jiangsu 221116, China;
    2. Ministry of Education Engineering Research Center of Mine Digitization, Xuzhou, Jiangsu 221116, China;
    3. Innovation Research Center of Disaster Intelligent Prevention and Emergency Rescue, Xuzhou, Jiangsu 221116, China
  • Received:2020-06-10 Revised:2020-12-11 Online:2021-04-25 Published:2021-04-25

摘要: 近些年来随着遥感技术的快速发展,遥感图像目标检测成为了当前的研究热点.针对遥感图像背景复杂以及现有目标检测模型缺乏可解释性等问题,本文提出了一种基于弱语义注意力的遥感图像可解释目标检测方法.具体地,首先通过多层级特征金字塔来解决遥感图像中目标尺度变化范围大的问题.其次,利用检测框的角度回归来解决遥感图像目标定向的问题.然后,基于弱语义分割网络产生强化目标特征的注意力权重值,抑制背景噪声.最终用网络剖析的分析方法,获取模型中卷积核对应的可解释性语义概念.实验结果表明,本文提出的算法在遥感图像目标检测的准确性以及对背景噪声抑制上有较好的表现,并且通过可解释性算法在一定程度上使本文提出的模型易于理解.

关键词: 目标检测, 遥感图像, 注意力网络, 弱语义, 深度学习可解释性

Abstract: In recent years,the object detection in remote sensing imagery has been a hot research spot with the development of remote sensing technique.To deal with the complex background in the imagery and the detection model’s interpretability,we propose a weakly semantic based attention network for interpretable object detection model in remote sensing imagery.Firstly,a feature pyramid network is devised for the variation of object scales.Next,an angle is added to the regression to better locate the object.Thirdly,we add a weakly semantic segmentation network to enhance feature and filter the noisy information in the background.Finally,the model is dissected by the proposed method to get the interpretable semantic concepts of convolutional kernel.Experiments validated that the model has a good performance in the aspect of suppressing the background noise and make our model easy to comprehend.

Key words: object detection, remote sensing imagery, attention network, weakly semantic, deep learning interpretability

中图分类号: