电子学报 ›› 2019, Vol. 47 ›› Issue (10): 2211-2220.DOI: 10.3969/j.issn.0372-2112.2019.10.024

• 综述评论 • 上一篇    下一篇

基于深度网络的图像语义分割综述

罗会兰, 张云   

  1. 江西理工大学信息工程学院, 江西赣州 341000
  • 收稿日期:2018-11-23 修回日期:2019-05-13 出版日期:2019-10-25
    • 作者简介:
    • 罗会兰 女,1974年9月生于江西上高.2008年获浙江大学工学博士学位.现为江西理工大学图像处理实验室教授、硕士生导师.主要从事机器学习、模式识别等方面的研究.E-mail:luohuilan@sina.com;张云 女,1992年1月生于河南信阳.2016年进入江西理工大学,在读硕士研究生.研究方向为语义分割.E-mail:1040344705@qq.com
    • 基金资助:
    • 国家自然科学基金 (No.61462035,No.61862031); 江西省青年科学家培养项目 (No.20153BCB23010); 江西省自然科学资金项目 (No.20171BAB202014)

A Survey of Image Semantic Segmentation Based on Deep Network

LUO Hui-lan, ZHANG Yun   

  1. School of Information Engineering, Jiangxi University of Science and Technology, Ganzhou, Jiangxi 341000, China
  • Received:2018-11-23 Revised:2019-05-13 Online:2019-10-25 Published:2019-10-25
    • Supported by:
    • National Natural Science Foundation of China (No.61462035, No.61862031); Young Scientists Cultivation Program of Jiangxi Province (No.20153BCB23010); Natural Science Foundation of Jiangxi Province,  China (No.20171BAB202014)

摘要: 图像语义分割不仅预测一幅图像中的不同类别,同时还定位不同语义类别的位置,具有重要的研究意义和应用价值.本文阐述了图像语义分割最新的研究成果和方法,从三个角度综述了基于深度卷积神经网络的图像语义分割模型,分别是基于候选区域模型、基于全卷积网络模型和基于弱监督学习的语义分割模型,对这三类模型的方法和结构进行了详细的研究和分析.并在PASCAL VOC 2012数据集上对一些代表性的语义分割算法的性能进行了比较分析.

关键词: 图像语义分割, 深度卷积神经网络, 候选区域, 全卷积网络, 弱监督学习, PASCAL VOC 2012数据集

Abstract: Image semantic segmentation not only predicts different categories in an image, but also orientates different semantic categories locations, which has important research significance and application value. This paper expounds the latest research results and methods of image semantic segmentation,and from three perspectives: based candidate region models、based full convolutional network models and based weakly-supervised learning models. The image semantic segmentation model methods and structure based on deep convolutional neural network are deeply overviewed in this paper. This paper compares the performance of some representative semantic segmentation algorithms on the PASCAL VOC 2012 dataset.

Key words: image semantic segmentation, deep convolutional neural network, candidate region, full convolution network, weakly-supervised learning, PASCAL VOC 2012 dataset

中图分类号: