电子学报 ›› 2013, Vol. 41 ›› Issue (9): 1800-1808.DOI: 10.3969/j.issn.0372-2112.2013.09.021

• 综述评论 • 上一篇    下一篇

Web查询日志研究综述

付博1, 赵世奇1,2, 刘挺1   

  1. 1. 哈尔滨工业大学计算机学院社会计算与信息检索研究中心, 黑龙江哈尔滨 150001;
    2. 百度公司, 北京 100085
  • 收稿日期:2012-05-30 修回日期:2012-08-28 出版日期:2013-09-25 发布日期:2013-09-25
  • 作者简介:付 博 女,1983年10月出生于黑龙江海伦.哈尔滨工业大学计算机科学与技术学院博士研究生.主要研究方向为信息检索和社会计算. E-mail:bfu@ir.hit.edu.cn;赵世奇 男,1981年6月出生于辽宁抚顺.博士,CCF学生会员,主要研究方向为自然语言处理和知识挖掘. E-mail:zhaosq@ir.hit.edu.cn;刘 挺 男,1972年2月出生于黑龙江哈尔滨.现为哈尔滨工业大学计算机科学与技术学院教授、博士生导师.主要研究方向为自然语言处理、信息检索和社会计算. E-mail:tliu@ir.hit.edu.cn
  • 基金资助:
    国家自然科学基金(No.60736044,No.61073126)

Research on Analysis and Mining of Web Query Logs

FU Bo1, ZHAO Shi-qi1,2, LIU Ting1   

  1. 1. Center for Information Retrieval, School of Computer Science and Technology, Harbin Institute of Technology, Harbin, Heilongjiang 150001, China;
    2. Baidu Inc., Beijing 100085, China
  • Received:2012-05-30 Revised:2012-08-28 Online:2013-09-25 Published:2013-09-25

摘要: 本文对查询日志在相关领域内的研究现状与进展进行了总结.首先介绍了web查询日志的常用信息和公开的数据集;进而阐述了查询日志在web搜索、信息抽取等方面的相关研究,并对它们进行了细致的介绍和分析;最后指出基于查询日志研究所面临的问题和挑战.重在对基于查询日志研究的主流方法和前沿进展进行概括、比较和分析,以期对后续研究有所助益.

关键词: 查询日志分析, 查询日志挖掘, web搜索, 信息抽取

Abstract: This paper surveys the state-of-the-art research on query logs analysis.First,the existing corpus of query logs and the information embedded in are summarized and analyzed.Then,important tasks benefiting from query logs are introduced,including web search,information extraction,as well as some closely related topics.Finally,the problems and challenges of current researches are discussed.This paper aims to make a summary,comparison and analysis of the mainstream methods and the latest progress,expecting to be helpful to the future research.

Key words: analysis on query logs, mining on query logs, web search, information extraction

中图分类号: