电子学报 ›› 2018, Vol. 46 ›› Issue (12): 2930-2935.DOI: 10.3969/j.issn.0372-2112.2018.12.015

• 学术论文 • 上一篇    下一篇

基于存储库数据挖掘的开源软件成功度量方法

宁德军1, 叶培根2, 刘琴1, 李梅3   

  1. 1. 同济大学软件学院, 上海 201210;
    2. 上海大学通信与信息工程学院, 上海 201210;
    3. 中国科学院上海高等研究院智慧城市研究中心, 上海 201210
  • 收稿日期:2017-11-21 修回日期:2018-04-11 出版日期:2018-12-25
    • 作者简介:
    • 宁德军 男,1972年7月出生于黑龙江省.教授级工程师,CCF会员.长期从事下一代软件工程技术、大数据智能技术和海云协同计算研究.E-mail:ningdj@sari.ac.cn;叶培根 男,1992年2月出生于河南省濮阳市.研究生,主要研究方向为软工数据智能和海云计算.E-mail:yepg@sari.ac.cn;刘琴 女,同济大学软件学院教授、博士生导师,CCF会员.主要研究方向为软件与数据工程、异构数据相关性分析、基于历史数据的预测模型与应用.E-mail:qin.liu@tongji.edu.cn;李梅 女,1993年10月出生于江苏东台.研究生.主要研究方向为软工数据智能、数据挖掘、智能推荐.E-mail:limei@sari.ac.cn
    • 基金资助:
    • 中国科学院战略性先导科技专项 (No.XDA06000000); 国家重点研发计划项目 (No.2016YFB1000805); 上海市"科技创新行动计划"基础研究重点科技项目 (No.17511107303,17511110202); 上海市扬帆计划 (No.17YF1420500)

Open Source Software Success Measurement Method Based on Mining Software Repository

NING De-jun1, YE Pei-gen2, QIN Liu1, MEI Li3   

  1. 1.School of Software Engineering, Tongji University, Shanghai 201210, China;
    2.School of Communication and Information Engineering, Shanghai University, Shanghai 201210, China;
    3.Shanghai Advanced Research Institute, Chinese Academy of Science, Shanghai 201210, China
  • Received:2017-11-21 Revised:2018-04-11 Online:2018-12-25 Published:2018-12-25

摘要: 开源软件已广泛应用于各软件领域,例如操作系统、容器等,但目前尚没有一种能够综合度量开源软件的方法.我们在用户兴趣度量和开发参与度量的基础上,提出了一种能够克服度量维度单一的局限性的度量方法.基于DM模型、软件生存力模型等相关文献研究和开源软件存储库数据挖掘,通过对项目过程数据进行聚类、主成分分析、回归分析和对开发过程的思考,本文提出一种基于存储库数据和统计学算法的开源软件成功度度量模型.并通过与用户兴趣度量结果和开发参与度量结果对比分析,证明本文的度量模型能够基于可自动无扰采集的存储库数据,更全面的衡量开源软件项目的成功.度量模型可应用于企业选择优质开源项目、学术研究、智能项目推荐等领域.

关键词: 开源软件, 主成分分析, 成功度量模型, 数据挖掘, 量化分析, 软件工程, DM模型, 软件生存力模型

Abstract: The open source software (OSS) is widely used in various software fields, such as operating system, container, etc. But there is no method to measure open source software comprehensively. Based on the measurement of user interest and the development of participation metrics, we propose a method that can overcome the single limitation of the metric dimension. Based on DM model, software viability model and other relevant literature research, mining of software repository, we consider the OSS development process and propose an OSS success evaluation model through clustering, principal component analysis and regression analysis. By comparing the metric score of user interest method and development participation method, the evaluation model can be used to measure the success of OSS projects based on the data collected automatically without interference. The evaluation model can be applied to select high quality open source projects, academic research, intelligent project recommendation, etc.

Key words: open source software, principal component analysis, success measurement model, data mining, quantitative analysis, software engineering, DM model, software viability model

中图分类号: