%0 Journal Article %A 孙新 %A 盖晨 %A 申长虹 %A 张颖捷 %T 基于短语向量和主题加权的关键词抽取方法 %D 2021 %R 10.12263/DZXB.20200014 %J 电子学报 %P 1682-1690 %V 49 %N 9 %X

现有关键词抽取算法缺乏对短语的有效表示,为抽取出更能反映文本主题的关键短语,本文提出一种基于短语向量的关键词抽取方法PhraseVecRank.首先设计基于LSTM(Long Short-Term Memory)和CNN(Convolutional Neural Network)自编码器的短语向量构建模型,解决复杂短语的语义表示问题.然后,利用短语向量对每个候选短语计算主题权重,通过主题加权排序提高关键词抽取的效果.在公共数据集和学术论文数据上的实验表明,本文提出的方法能够有效提取与文本主题信息相关的关键短语,同时利用自编码器构造的短语向量可以更好地表示短语的语义信息.

%U https://www.ejournal.org.cn/CN/10.12263/DZXB.20200014