电子学报 ›› 2020, Vol. 48 ›› Issue (9): 1720-1728.DOI: 10.3969/j.issn.0372-2112.2020.09.008

• 学术论文 • 上一篇    下一篇

一种基于情感计算与层次化多头注意力机制的负面新闻识别方法

张仰森1,3, 周炜翔1, 张禹尧1, 吴云芳2   

  1. 1. 北京信息科技大学智能信息处理研究所, 北京 100101;
    2. 北京大学计算语言学研究所, 北京 100871;
    3. 国家经济安全预警工程北京实验室, 北京 100044
  • 收稿日期:2019-08-26 修回日期:2019-10-31 出版日期:2020-09-25
    • 作者简介:
    • 张仰森 男,1962年6月出生于山西临猗,博士后,教授,研究方向为中文信息处理、人工智能.E-mail:zhangyangsen@163.com
      周炜翔 男,1993年5月出生于河北唐山,硕士研究生,研究方向中文信息处理.E-mail:zwx0286@163.com
      张禹尧 男,1996年9月出生于北京密云,硕士研究生,研究方向为中文信息处理.E-mail:13716580192@163.com
      吴云芳 女,1973年3月生于山西,博士,副教授,研究方向为语义计算,智能问答.E-mail:wuyf@pku.edu.cn
    • 基金资助:
    • 国家自然科学基金 (No.61772081); 科技创新服务能力建设-科研基地建设-北京实验室-国家经济安全预警工程北京实验室项目 (No.PXM2018_014224_000010); 促进高校内涵发展— — 研究生科技创新项目 (No.5121911044)

A Negative News Recognition Method Based on Emotional Computing and Hierarchical Multi-head Attention Mechanism

ZHANG Yang-sen1,3, ZHOU Wei-xiang1, ZHANG Yu-yao1, WU Yun-fang2   

  1. 1. Institute of Intelligent Information Processing, Beijing Information Science and Technology University, Beijing 100101, China;
    2. Institute of Computational Linguistics, Peking University, Beijing 100871, China;
    3. Beijing Laboratory of National Economic Security Early-Warning Engineering, Beijing 100044, China
  • Received:2019-08-26 Revised:2019-10-31 Online:2020-09-25 Published:2020-09-25

摘要: 网络负面新闻识别在网络舆情监测中具有重要的研究意义.针对当前海量数据下负面新闻难以检测的问题,提出了一种基于情感计算与层次化多头注意力机制相结合的负面新闻识别方法.首先,从新闻文本中采用TF-IDF(Term Frequeney-Inverse Document Frquency)和语义相似度算法构建负面新闻情感词库;其次,采用情感倾向计算方法计算负面新闻情感词的情感倾向度;最后,将词语和词语的情感倾向度进行向量化表示,并采用层次化多头注意力机制进行正负面新闻的判定.情感计算和多头注意力机制的引入,对于捕获文本中的情感词语提供了很大帮助.最终本文基于真实的网络新闻文本数据与现有的多种算法进行对比,证明了该模型具有较好的识别效果,相比于Han模型和LSTM模型分别提高了0.67%和3.29%.

关键词: 语义相似度, 情感计算, 多头注意力模型, 情感倾向

Abstract: Identification of network negative news has important research significance in network public opinion monitoring.Aiming at the problem that negative news is difficult to detect under the current mass data,this paper proposes a method of negative news recognition based on emotional computing and hierarchical multi-head attention mechanism.Firstly,this paper uses TFIDF(Term Frequeney-Inverse Document Frquency) and emotional similarity algorithm to construct negative news emotional lexicon from news texts.Secondly,this paper uses the method of emotional tendency calculation to calculate the degree of emotional tendency of negative news affective words.Finally,the model vectorizes the emotional tendencies of words and expressions,and use hierarchical multi-attention model to judge the positive and negative emotions of news.The introduction of emotional computing and multi-attention mechanism is of great help in capturing emotional words in texts.Finally,this paper compares the real network news text data with many existing algorithms,and proves that the model has a good recognition effect.Compared with the Han model and LSTM model,it is increased by 0.67% and 3.29% respectively.

Key words: semantic similarity, emotional computing, multi-head attention mechanism, emotional tendency

中图分类号: