1. 中国科学技术大学计算机科学技术系,安徽,合肥,230027
2. 安徽省计算与通讯软件重点实验室,安徽,合肥,230027
3. 解放军保密委员会技术安全研究所,北京,100091
4. 中国科学技术大学计算机科学技术系安徽合肥,230027
5. 安徽省计算与通讯软件重点实验室安徽合肥,230027
6. 解放军保密委员会技术安全研究所北京,100091
纸质出版:2009
移动端阅览
闫 瑞, 曹先彬, 李 凯. 面向短文本的动态组合分类算法[J]. 电子学报, 2009,37(5):1019-1024.
YAN Rui, CAO Xian-bin, LI Kai. Dynamic Assembly Classification Algorithm for Short Text[J]. Acta Electronica Sinica, 2009, 37(5): 1019-1024.
短文本分类是网络内容安全的一种主要方法.然而
短文本固有的关键词特征稀疏和样本高度不均衡等特点
使得难以直接使用现有针对长文本的分类算法.本文提出了一种针对短文本的动态组合分类算法.首先构造出一种树状组合分类器结构
可有效缓解短文本特征稀疏和样本高度不均衡对分类性能的影响;进一步
提出了一种动态调整策略来训练组合分类器
可以根据样本的分布特点自适应地调整分类器的组合结构.测试实验表明
相对于传统的单一分类方法和集成分类方法
动态组合分类算法在短文本分类中可以获得更好的准确率和召回率.
Short text classification is a key technology in network content security application.However
the sparse features and unbalanced data of the short text make the traditional text classification method incompetent for short text classification.This paper proposed a dynamic assembly classification method for short text classification.In this method
a treelike assembly classifier was constructed to support the classification
which reduced the impact of the sparse features and unbalanced data of the short texts.Further
a dynamic adjusting strategy was presented in the construction procedure
which adjusted the combinational structure of the classifier in an adaptive way.The experimental results show that
comparing with the traditional classifiers such as single classifier and ensemble classifier
the proposed assembly classifier gets better precision rate and recall rate.
0
浏览量
1757
下载量
13
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621