电子学报 ›› 2016, Vol. 44 ›› Issue (12): 2989-2996.DOI: 10.3969/j.issn.0372-2112.2016.12.025

• 学术论文 • 上一篇    下一篇

基于转发传播过程的微博转发量预测

赵惠东, 刘刚, 石川, 吴斌   

  1. 北京邮电大学智能通信软件与多媒体北京市重点实验室, 北京 100876
  • 收稿日期:2015-02-03 修回日期:2015-08-04 出版日期:2016-12-25 发布日期:2016-12-25
  • 作者简介:赵惠东,男,1990年11月出生,辽宁沈阳人,2013年在北京邮电大学获得学士学位,现为北京邮电大学计算机学院硕士研究生,研究方向为数据挖掘.E-mail:zhaohuidong1121@foxmail.com;刘刚,男,1989年5月出生,辽宁沈阳人,2012年在北京邮电大学获得学士学位,2015年在北京邮电大学获得工学硕士学位,研究方向为数据挖掘;石川,男,1978年4月出生,湖北洪湖人,教授、博士生导师、IEEE/ACM/CCF会员.2001年在吉林大学获得学士学位,2004年在武汉大学获得硕士学位,2007年在中国科学院计算技术研究所获得博士学位.2007年加入北京邮电大学,研究方向包括机器学习、数据挖掘和演化计算;吴斌,男,1969年11月出生,湖南长沙人,教授、博士生导师,2002年中国科学院计算技术研究所博士毕业,现在北京邮电大学计算机学院工作,主要从事复杂网络、数据挖掘、海量数据并行处理、可视分析、电信客户关系管理等方面的研究工作.
  • 基金资助:

    国家重点基础研究发展计划(No.2013CB329606);国家自然科学基金(No.61375058,No.71231002);北京市高等教育青年英才项目

Retweet Number Prediction Based on Retweet Propagation Process

ZHAO Hui-dong, LIU Gang, SHI Chuan, WU Bin   

  1. Beijing Key Lab of Intelligent Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijng 100876, China
  • Received:2015-02-03 Revised:2015-08-04 Online:2016-12-25 Published:2016-12-25

摘要:

微博已经成为日常生活中最流行的信息分享工具.转发是微博中信息传播的核心方法,所以转发量预测不仅是一个有趣的研究问题,也有较大的实际意义.然而,当前大部分研究只是把问题视为分类或回归问题,没有考虑转发的传播过程.本文中,我们提出一个符合转发传播过程的转发量预测模型.本文认为转发信息来自两方面:直接粉丝和间接粉丝,而粉丝带来的转发量由转发意愿和影响力决定.我们用历史行为和内容相关性来估算一名直接粉丝的转发意愿,并用他/她的影响力来估算通过他/她的间接粉丝的转发量.新浪微博上的实验表明我们的模型比其他已有的方法效果好.

关键词: 转发量预测, 转发意愿, 转发影响力

Abstract:

Micro-blog has become the most popular information sharing tool in our daily life.The retweet behavior is a main method of information propagation in micro-blog.So the retweet number prediction is an interesting research topic and has much practical significance.However,most of current researches only regard this problem as aclassification or regression problem,and they did not consider the retweet propagation process.Considering the retweet propagation process,we propose a retweet number prediction model BCI.In our model,we think retweet messages are from two parts,direct followers and indirect followers.The retweet number of followers is decided by their retweet intention and influence.We use behavior and content information to estimate retweet intention for a direct follower and use the influence to estimate the indirect followers' retweet number.Experimental results on Sina Weibo dataset show that our retweet number prediction model has much better performance than other well-established methods.

Key words: retweet number prediction, retweet intention, the influence on retweeting

中图分类号: