电子学报 ›› 2013, Vol. 41 ›› Issue (12): 2334-2338.DOI: 10.3969/j.issn.0372-2112.2013.12.003

• 学术论文 • 上一篇    下一篇

基于聚类分析的软件胎记特征选择

罗养霞1,2, 房鼎益2   

  1. 1. 西安财经学院信息学院, 陕西西安 710100;
    2. 西北大学信息科学与技术学院, 陕西西安 710127
  • 收稿日期:2012-10-21 修回日期:2013-02-20 出版日期:2013-12-25 发布日期:2013-12-25
  • 作者简介:罗养霞 女,1974年1月出生,陕西户县人.西安财经学院信息学院任教,讲师.西北大学信息学院,在读博士生,从事软件保护、水印、胎记方面的研究. E-mail:yxluo8836@163.com 房鼎益 男,1959年3月出生,陕西汉中人.西北大学信息学院教授、博士生导师.主要研究方向为网络与信息安全、无线传感器网络及其应用.
  • 基金资助:

    国家自然科学基金(No.61070176,No.61170218,No.61272461);国家级大学生创新项目(No.201311560008);陕西省教育厅科研计划项目(No.2013JK1200);陕西省自然科学基础研究(No.2012JM8034);陕西省教育厅产业化项目(No.2011JG06)

Feature Selection for Software Birthmark Based on Cluster Analysis

LUO Yang-xia1,2, FANG Ding-yi2   

  1. 1. School of Information, Xi'an University of Finance and Economics, Xi'an, Shaanxi 710100, China;
    2. School of Information Science and Technology, Northwest University, Xi'an, Shaanxi 710127, China
  • Received:2012-10-21 Revised:2013-02-20 Online:2013-12-25 Published:2013-12-25

摘要: 软件胎记选择关系着软件的识别率.本文应用约束聚类分析软件特征,基于互信息度量特征的类内和类间距离,以同类和异类软件特征构建信息增益函数和惩罚函数,选择出具有高的类区分信息和最小冗余的软件胎记特征.通过分析和比较表明该算法为软件胎记特征的选择和优化提供了一种有效途径.

关键词: 胎记特征选择, 聚类分析, 信息度量, 关联系数

Abstract: The feature selection for software birthmark has a direct bearing on software recognition rate.We apply constrained clustering to analyze software features.The within-and between-class distances of features are measured based on mutual information.Information gain and penalty functions are constructed using homogeneous and heterogeneous software features respectively.Then the software birthmark features with high class distinction and minimum redundancy are selected.It is shown the algorithm provide an effective approach for software birthmark feature selection and optimization by analysis and comparison.

Key words: birthmark feature selection, clustering analysis, information measurement, correlation coefficient

中图分类号: