电子学报 ›› 2017, Vol. 45 ›› Issue (2): 328-336.DOI: 10.3969/j.issn.0372-2112.2017.02.010

• 学术论文 • 上一篇    下一篇

基于多条件随机场模型的图像3D空间布局理解

刘威1,2, 周婷2, 袁淮1, 赵宏1   

  1. 1. 东北大学研究院, 辽宁沈阳 110819;
    2. 东软集团股份有限公司, 辽宁沈阳 110179
  • 收稿日期:2015-06-12 修回日期:2015-12-09 出版日期:2017-02-25
    • 作者简介:
    • 刘威,男,1975年6月出生,辽宁沈阳人,博士,东北大学副教授,教授级高级工程师.主要研究领域为汽车辅助驾驶、智能交通、智能安防,研究方向为计算机视觉、图像处理、模式识别.E-mail:lwei@neusoft.com;周婷,女,1990年2月出生,四川乐山人,东软汽车电子研究员.主要研究领域为汽车辅助驾驶、自动驾驶,研究方向机器学习.E-mail:zhou_ting@neusoft.com
    • 基金资助:
    • 国家自然科学基金 (No.61273239); 中央高校基本业务费 (No.N151802001)

3D Spatial Layout Understanding from Image Based on Multiple CRFs

LIU Wei1,2, ZHOU Ting2, YUAN Huai1, ZHAO Hong1   

  1. 1. Research Academy, Northeastern University, Shenyang, Liaoning 110819, China;
    2. Neusoft Corporation, Shenyang, Liaoning 110179, China
  • Received:2015-06-12 Revised:2015-12-09 Online:2017-02-25 Published:2017-02-25
    • Supported by:
    • National Natural Science Foundation of China (No.61273239); Fundamental Research Funds for the Central Universities (No.N151802001)

摘要:

图像3D空间布局理解在自动驾驶系统以及目标识别中扮演着重要的角色.本文提出一种基于多条件随机场模型集成的图像3D空间布局理解算法.首先,基于多次图像分割生成多个不同尺度的超像素图像;然后,结合LBP表面纹理特征、LM滤波器组获得的方向纹理特征、颜色特征以及图像中超像素的位置和形状特征,建立各尺度的超像素图像中超像素的特征表达;最后,为各尺度的超像素图像分别构建相应的条件随机场模型,并应用D-S证据合成理论对多个条件随机场模型的推断结果进行集成,实现对图像3D空间布局的理解.在公共数据集GC和KITTI Layout上的实验结果表明,同已有算法相比,本文提出的算法提高了图像3D空间布局理解的准确率.

关键词: 3D空间布局, 多次图像分割, 超像素特征表达, 条件随机场模型, 证据合成

Abstract:

3D spatial layout understanding from images plays an important role in the autonomous driving and object recognition.This paper proposes a 3D spatial layout understanding algorithm based on multiple CRFs.Firstly,multiple different scales super-pixel image are generated based on the multiple segmentation.Then,the feature of super-pixel are constructed based on LBP surface texture feature,orientation texture feature from LM filters,color feature,and location and shape feature of super-pixels in the image.Finally,the CRF model on every scale super-pixel image is built,the Dempster-Shafer theory of evidence is used to integrate the inference result of multiple CRF models and the 3D spatial layout understanding from an image is realized.The experiments on the public database Geometric Context and KITTI Layout demonstrate that the algorithm proposed in this paper improves the average accuracy of 3D spatial layout understanding comparing to the existing state-of-art.

Key words: 3D spatial layout, multiple image segmentation, feature of super-pixel, conditional random field models, evidence combine

中图分类号: