电子学报 ›› 2015, Vol. 43 ›› Issue (5): 956-964.DOI: 10.3969/j.issn.0372-2112.2015.05.019

• 学术论文 • 上一篇    下一篇

一种支持轨迹大数据潜在语义相关性挖掘的谱聚类方法

廖律超1,2, 蒋新华1,2, 邹复民2, 贺文武2, 邱淮3   

  1. 1. 中南大学信息科学与工程学院, 湖南长沙 410075;
    2. 福建工程学院福建省汽车电子与电驱动技术重点实验室, 福建福州 350108;
    3. 福建省交通运输厅福建省交通信息通信中心, 福建福州 350001
  • 收稿日期:2014-04-14 修回日期:2015-01-07 出版日期:2015-05-25 发布日期:2015-05-25
  • 作者简介:蒋新华 男,1956年生于湖南长沙,博士生导师,中南大学交通信息工程及控制学科教授,福建工程学院教授.主要研究方向为交通大数据处理关键技术、智能控制理论与先进PID控制方法、下一代移动互联网关键技术.E-mail:xhjiang@fjut.edu.cn;邹复民 男,1976年生于湖南隆回,博士,现为福建工程学院信息科学与工程学院教授,主要研究方向为车联网、交通信息工程与云计算技术.E-mail:fmzou@fjut.edu.cn;贺文武 男,1972年生于湖南常德,理学博士,现为福建工程学院数理系副教授,美国密歇根大学访问学者.主要研究方向为统计机器学习与数据挖掘等.E-mail:hwwhbb@163.com;邱淮 男,1963年生于福建上杭,教授级高工,现就职于福建省交通运输厅,主要研究方向:交通信息采集,异构交通信息融合及交通运输云计算平台关键技术等.
  • 基金资助:

    国家自然科学基金(No.61304199,No.41471333,No.61101139);福建省高校杰出青年科研人才计划(No.JA14209);福建省自然科学基金(No.2013J01214,No.2012J01247);福建省科技重大专项专题项目(No.2011HZ0002-1,No.2013HZ0002-1);福建省交通科技计划(No.201318)

A Spectral Clustering Method for Big Trajectory Data Mining with Latent Semantic Correlation

LIAO Lü-chao1,2, JIANG Xin-hua1,2, ZOU Fu-min2, HE Wen-wu2, QIU Huai3   

  1. 1. School of Information Science and Engineering, Central-South University, Changsha, Hunan 410075, China;
    2. Fujian Key Laboratory for Automotive Electronics and Electric Drive, Fujian University of Technology, Fuzhou, Fujian 350108, China;
    3. Fujian Transport Information &Telecommunications Center, Fujian Communication Department, Fuzhou, Fujian 350001, China
  • Received:2014-04-14 Revised:2015-01-07 Online:2015-05-25 Published:2015-05-25

摘要:

针对交通管理优化和轨迹大数据挖掘的实际应用需求,本文提出了一种支持交通轨迹大数据潜在语义相关性挖掘的交通路网谱聚类方法(TSSC).首先研究了交通轨迹数据的向量空间建模方法,其次通过随机投影法快速提取大规模轨迹数据矩阵的特征信息并构建其低维语义子空间,然后基于语义子空间挖掘轨迹数据的潜在语义相关特性,在此基础上通过谱聚类方法实现了交通路网的快速聚类.通过本文提出的方法对总里程1400多万公里的实际交通轨迹数据进行实验分析表明,本方法可根据交通轨迹大数据的潜在语义相关性对交通路网进行快速的谱聚类处理,从而在复杂的交通路网间快速挖掘其潜在特性,为交通规划及其管理优化提供决策支持信息,同时也为时空大数据的聚类挖掘提供了一种新的解决方案.

关键词: 交通轨迹, 大数据, 数据挖掘, 语义空间, 谱聚类

Abstract:

To facilitate traffic understanding,planning and management optimization,we present a new spectral clustering method(TSSC) for big trajectory data mining based on latent semantic correlation.First,a matrix model is proposed to represent vehicle trajectories and the underlying road network with a grid-vehicle matrix,which is then transformed to a low-dimensional semantic subspace with random projection.Second,through matrix decomposition we extract hidden characteristics of the mass trajectory data and construct a similarity matrix for road network cells.Third,we adopt and implement a fast spectral clustering method to discover road network clusters based on the similarity matrix in the semantic space.Finally,we evaluate our approach with a large trajectory data set collected by the Fujian Communications Department,which has 19,719 vehicles and a total mileage of more than 14 million kilometers.Experiment results show that the approach can efficiently cluster the road network with traffic context semantic information derived from massive trajectory data.The approach is capable to discover inherent characteristics of complex road networks and provide insights for traffic planning and management optimization.

Key words: traffic trajectory, big data, data mining, semantic space, spectral clustering

中图分类号: