构建系统发生树是研究物种起源和演化的重要手段.本文基于KEGG(Kyoto Encyclopedia of Genes and Genomes)代谢路径,引入图论的"核"概念,提出一种构建系统发生树的方法.首先解决在无数据丢失前提下,代谢路径数据的提取和表示问题,其次将不同代谢路径的相似度定义为图的核部分与非核部分各自匹配程度的加权之和,利用距离矩阵构建物种间的系统发生树.通过大量试验数据和NCBI(National Center for Biotechnology Information)分类法进行比较,验证了本文方法的有效性.
如何降低高维数据的维数而不损失原有数据的内在信息是机器学习和数据挖掘领域中的热点问题.本文在图嵌入框架的基础上提出一种新的降维分析算法IKLDA(improved kernel Linear discriminant analysis),不仅使得隐藏在图像的信息能被区分出来,而且大大降低了数据的维数,理论分析及实验结果表明IKLDA的降维隐写分析是有效的,比其它传统降维方法效果要好,并且进一步推进了数据挖掘可视化方法在隐写分析的应用.