电子学报 ›› 2015, Vol. 43 ›› Issue (7): 1266-1274.DOI: 10.3969/j.issn.0372-2112.2015.07.003

• 学术论文 • 上一篇    下一篇

面向领域标签辅助的服务聚类方法

田刚1,2, 何克清1, 王健1, 孙承爱2, 徐建建2   

  1. 1. 武汉大学软件工程国家重点实验室, 武汉大学计算机学院, 湖北武汉 430072;
    2. 山东科技大学信息学院, 山东青岛 266590
  • 收稿日期:2014-10-14 修回日期:2015-02-03 出版日期:2015-07-25 发布日期:2015-07-25
  • 通讯作者: 王健
  • 作者简介:田 刚 男,1982年1月出生,山东青州人,武汉大学在读博士研究生,CCF会员,主要研究领域为服务计算、知识工程、机器学习等.何克清 男,武汉大学计算机学院教授,CCF高级会员,主要研究领域为服务计算、软件工程等.
  • 基金资助:

    国家973重点基础研究发展计划(No.2014CB340404);国家自然科学基金(No.61373037,No.61202031);重点实验室开放课题(No.SKLSE 2014-10-07)

Domain-Oriented and Tag-Aided Web Service Clustering Method

TIAN Gang1,2, HE Ke-qing1, WANG Jian1, SUN Cheng-ai2, XU Jian-jian2   

  1. 1. State Key Laboratory of Software Engineering School of Computer, Wuhan University, Wuhan, Hubei 430072, China;
    2. College of Information Science, Shandong University of Science and Technology, Qingdao, Shandong 266590, China
  • Received:2014-10-14 Revised:2015-02-03 Online:2015-07-25 Published:2015-07-25

摘要:

Web服务数量的激增对服务发现提出了更高的要求,服务聚类是促进服务发现的一种重要技术.但是,现有服务聚类方法只对单一类型的服务文档进行聚类,缺乏考虑服务的领域特性和服务标签的应用.针对这些问题,本文首先使用本体辅助的支持向量机和面向领域的服务特征降维技术建立服务的特征内容向量,然后使用一种标签辅助的主题服务聚类方法T-LDA建立融合标签信息之后的隐含主题表示,并利用归一化方法消除通用主题的影响,综合上述方法建立一个面向领域标签辅助的Web服务聚类方法DTWSC.实验结果表明,该框架能够提高针对不同类型的服务文档的聚类效果.与LDA、K-Means等方法相比,该方法在聚类纯度、熵和F-Measure指标上均具有更好的效果.

关键词: Web服务聚类, 面向领域, 标签辅助, 主题模型

Abstract:

The growing number of web services puts forward higher requirements for searching desired web services and clustering Web services can greatly enhance the discovery of Web service.However,the existing clustering approaches are only for a single type of service documents,and they are lacking of considering the domain characteristic and the tags information of services.To solve these problems,the proposed approach constructs the feature vectors of Web service contents by using ontology empowered SVM and domain oriented feature dimension reduction technology.Then a tag aided service clustering model called T-LDA is proposed to construct the hidden topic representations of Web service and general topical information which has less discriminative power is normalized.Finally all methods mentioned above are combined to form the domain oriented and tag aided Web service clustering (DTWSC).Experimental results show that the proposed approach can improve the effect of clustering.Compared with the approaches of LDA and K-means,the proposed approach achieves better performance of the purity,entropy and F-measure.

Key words: Web service clustering, domain-oriented, tag aided, topical model

中图分类号: