%0 Journal Article %A 尤殿龙 %A 郭松 %A 赵春慧 %A 原福永 %A 申利民 %A 陈真 %T 面向分类的流特征在线特征选择算法 %D 2020 %R 10.3969/j.issn.0372-2112.2020.02.015 %J 电子学报 %P 321-332 %V 48 %N 2 %X 在线流特征选择通过实时过滤无关特征和冗余特征,实现流特征空间降维.针对已有算法,如Alpha-investing分类精度低、SAOLA选择特征数多和OSFS在低冗余高相关数据集下运行时间长的问题,提出了一种面向分类的流特征在线特征选择算法——OSFIC.算法运用四层过滤框架,通过无条件独立过滤不相关新特征、单条件下互信息过滤冗余新特征和候选特征集合中的部分冗余特征,最后通过多条件独立过滤候选特征集中的剩余冗余特征,最终得到分类标签的近似马尔可夫毯.为了分析OSFIC的性能,选择了NIPS 2003和Causality Workbench中的数据集,从预测精度、特征数量、运行时间和AUC方面与已有基准算法进行比较.实验表明,OSFIC平均分类精度比Alpha-investing提升4.41%.在保证精度的前提下,平均特征数量比SAOLA减少41.9%,运行时间比OSFS减少91.59%.最后,在真实的应用场景下验证了OSFIC的有效性. %U https://www.ejournal.org.cn/CN/10.3969/j.issn.0372-2112.2020.02.015