电子学报 ›› 2012, Vol. 40 ›› Issue (9): 1765-1774.DOI: 10.3969/j.issn.0372-2112.2012.09.011

• 学术论文 • 上一篇    下一篇

基于秩2更新的多维数据流典型相关跟踪算法

杨静, 李文平, 张健沛   

  1. 哈尔滨工程大学计算机科学与技术学院, 黑龙江哈尔滨 150001
  • 收稿日期:2011-10-24 修回日期:2012-04-16 出版日期:2012-09-25
    • 作者简介:
    • 杨 静 女,1962年2月出生于黑龙江省哈尔滨市.现为哈尔滨工程大学计算机科学与技术学院教授、博士生导师.主要研究方向为数据库与知识工程、数据挖掘技术、隐私保护、软件理论等. E-mail:yangjing@hrbeu.edu.cn 李文平 男,1979年10月出生于贵州省大方县.现为哈尔滨工程大学计算机科学与技术学院博士研究生.研究方向为数据库与知识工程、软件理论、数据挖掘技术、隐私保护. E-mail:liwenping@hrbeu.edu.cn 张健沛 男,1956年11月出生于哈尔滨市.现为哈尔滨工程大学计算机科学与技术学院教授、博士生导师.主要研究方向为数据库理论与应用、数据挖掘技术、软件理论、社会网络等. E-mail:zhangjianpei@hrbeu.edu.cn
    • 基金资助:
    • 国家自然科学基金 (No.61073043,No.61073041); 黑龙江省自然科学基金 (No.F200901); 哈尔滨市科技创新人才研究专项资金 (优秀学科带头人) (No.2011RFXXG015,No.2010RFXXG002); 高等学校博士学科点基金 (No.20112304110011)

A Tracking Algorithm Based on Rank Two Modifications for Canonical Correlation Analysis of Multidimensional Data Streams

YANG Jing, LI Wen-ping, ZHANG Jian-pei   

  1. College of Computer Science and Technology, Harbin Engineering University, Harbin, Heilongjiang 150001, China
  • Received:2011-10-24 Revised:2012-04-16 Online:2012-09-25 Published:2012-09-25
    • Supported by:
    • National Natural Science Foundation of China (No.61073043, No.61073041); Natural Science Foundation of Heilongjiang Province,  China (No.F200901); Harbin Science and Technology Innovation Talents Research Fund of Heilongjiang Province  (Excellent Academic Leader) (No.2011RFXXG015, No.2010RFXXG002); Doctoral Program Fund for Higher Education (No.20112304110011)

摘要: 现存的多维数据流典型相关分析(Canonical Correlation Analysis,简称CCA)算法主要是基于近似技术的求解方法,本质上并不是持续更新的精确算法.为了能在时变的环境中持续、快速而精确地跟踪数据流之间的相关性,本文提出一种多维数据流典型相关跟踪算法TCCA.该算法基于秩2更新理论,通过并行方式持续更新样本协方差矩阵的特征子空间,进而实现多维数据流典型相关的快速跟踪.理论分析及仿真实验结果表明,TCCA具有较好的稳定性、较高的计算效率和精度,可以作为基本工具应用于数据流相关性检测、特征融合、数据降维等数据流挖掘领域.

关键词: 多维数据流, 典型相关分析, 秩2更新, 快速跟踪, 特征子空间

Abstract: Existing algorithms for canonical correlation analysis(CCA) of multidimensional data streams are mostly based on approximate techniques,but are not the precise algorithms for updates in essence.In this study,a novel canonical correlation analysis algorithm,called TCCA(Tracking CCA),is proposed for tracking the correlations rapidly and accurately between two multidimensional data streams in the time-varying environments.By introducing the technique of rank two modifications to update the eigen-subspace of the sample covariance matrix in parallel,TCCA can rapidly track the correlations of data streams.Theoretical analysis and experimental results indicate that the TCCA algorithm has better stability,high computational efficiency and accuracy.It could be presented as a basic tool for correlation detection on data streams,feature fusion,dimension reduction and other areas of data streams mining.

Key words: multidimensional data streams, canonical correlation analysis, rank two modifications, fast tracking, eigen-subspace

中图分类号: