电子学报 ›› 2014, Vol. 42 ›› Issue (10): 2040-2044.DOI: 10.3969/j.issn.0372-2112.2014.10.026

• 科研通信 • 上一篇    下一篇

多视图有监督的LDA模型

李晓旭1, 李睿凡2,3, 冯方向2, 曹洁1, 王小捷2,3   

  1. 1. 兰州理工大学计算机与通信学院, 甘肃兰州 730050;
    2. 北京邮电大学计算机学院, 北京 100876;
    3. 教育部信息网络工程研究中心, 北京 100876
  • 收稿日期:2013-05-02 修回日期:2013-10-05 出版日期:2014-10-25 发布日期:2014-10-25
  • 作者简介:李晓旭 女,1982年生于吉林白城.兰州理工大学计算机与通信学院讲师.研究方向为计算机视觉、机器学习. E-mail:xiaoxulilut@gmail.com;李睿凡 男,1975年生于河北完县.北京邮电大学计算机学院讲师.主要研究兴趣为多模态智能信息处理. E-mail:rfli@bupt.edu.cn
  • 基金资助:

    国家自然科学基金(No.61263031);甘肃省自然科学基金(No.1310RJZA034);中央高校基本科研业务费专项资金(No.2013RC0304)

Multi-view Supervised Latent Dirichlet Allocation

LI Xiao-xu1, LI Rui-fan2,3, FENG Fang-xiang2, CAO Jie1, WANG Xiao-jie2,3   

  1. 1. College of Computer and Communication, Lanzhou University of Technology, Lanzhou, Gansu 730050, China;
    2. School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China;
    3. Engineering Research Center of Information Networks, Ministry of Education.Beijing 100876, China
  • Received:2013-05-02 Revised:2013-10-05 Online:2014-10-25 Published:2014-10-25

摘要:

本文主要关注多视图数据的分类问题.考虑到集成分类方法可组合多个弱分类器构成一个强分类器,以及主题模型能学习复杂数据的语义表示,本文试图将集成学习思想引入主题模型中,以便同时学习多视图数据的分类规则和预测性语义特征.具体地,结合概率主题模型LDA模型和集成分类方法Softmax混合模型,提出了一个多视图有监督的分类模型.基于变分EM方法,推导了该模型的参数估计算法.两个真实图像数据集上的实验结果表明了提出模型有较好的分类性能.

关键词: 多视图分类, 概率主题模型, 变分期望最大化

Abstract:

In the paper, we mainly focus on classifition on multi-view data.Considering that ensemble methods can combine weak classifiers to construct a strong classifier, and topic model can learn latent representations from complex data, we try to introduce ensemble idea to topic model, such that predictive latent representation could be obtained and multi-view classifier could be learned.We propose multi-view supervised latent Dirichlet allocation (multi-view sLDA) model by combining latent Dirichlet allocation model and the mixture of softmax model which is an ensemble classification model.Moreover, we derive a parameter estimation algorithm of the proposed model based on variational expectation maximization (EM) procedure.The experimental results on two real datasets show the effectiveness of the proposed model.

Key words: multi-view classification, probabilistic topic model, variational expectation maximization

中图分类号: