%0 Journal Article %A 脱婷 %A 马慧芳 %A 李志欣 %A 赵卫中 %T 熵权约束稀疏表示的短文本分类算法 %D 2020 %R 10.3969/j.issn.0372-2112.2020.11.006 %J 电子学报 %P 2131-2137 %V 48 %N 11 %X 针对短文本特征稀疏性问题,提出一种熵权约束稀疏表示的短文本分类方法.考虑到初始字典维数较高,首先,利用Word2vec工具将字典中的词表示成词向量形式,然后根据加权向量平均值对原始字典进行降维.其次,利用一种快速特征子集选择算法去除字典中不相关和冗余短文本,得到过滤后的字典.再次,基于稀疏表示理论在过滤后的字典上,为目标函数设计一种熵权约束的稀疏表示方法,引入拉格朗日乘数法求得目标函数的最优值,从而得到每个类的子空间.最后,在学习到的子空间下通过计算待分类短文本与每个类中短文本的距离,并根据三种分类规则对短文本进行分类.在真实数据集上的大量实验结果表明,本文提出的方法能够有效缓解短文本特征稀疏问题且优于现有短文本分类方法. %U https://www.ejournal.org.cn/CN/10.3969/j.issn.0372-2112.2020.11.006