电子学报 ›› 2019, Vol. 47 ›› Issue (8): 1692-1700.DOI: 10.3969/j.issn.0372-2112.2019.08.012

• 学术论文 • 上一篇    下一篇

基于改进注意力机制的实体关系抽取方法

冯建周1, 宋沙沙1, 王元卓1,2, 刘亚坤1, 武红颖1, 龚昊1   

  1. 1. 燕山大学信息科学与工程学院, 河北秦皇岛 066000;
    2. 中国科学院计算技术研究所, 北京 100080
  • 收稿日期:2017-11-27 修回日期:2019-03-22 出版日期:2019-08-25 发布日期:2019-08-25
  • 作者简介:冯建周 男,1978年2月出生于河北省沧州市.现为燕山大学软件工程系副教授、硕士生导师.主要研究方向为语义web、知识图谱.E-mail:fjzwxh@ysu.edu.cn;宋沙沙 女,1992年5月出生于河北省沧州市.现为燕山大学计算机科学与技术专业研究生.主要研究方向为知识图谱.E-mail:songshasha@he.chinamobile.com;王元卓 男,1978年7月出生于黑龙江齐齐哈尔市.现为中国科学院计算技术研究所科研处副处长、研究员、博士研究生导师.主要研究方向为开放网络知识计算.E-mail:wangyuanzhuo@ict.ac.cn;刘亚坤 男,1997年12月出生于河北省唐山市.现为燕山大学软件工程系本科生,主要研究方向为知识图谱.E-mail:2510278539@qq.com;武红颖 女,1995年8月出生于河北衡水市.现为燕山大学计算机技术专业研究生.主要研究方向为知识图谱.E-mail:mwuhongying@163.com;龚昊 男,1997年4月出生于河北省保定市.现为燕山大学软件工程系本科生.主要研究方向为知识图谱.E-mail:aininot260@qq.com
  • 基金资助:
    国家自然科学基金青年基金(No.61602401);河北省教育厅高等学校科技计划青年基金项目(自然类)(No.QN2018074)

Entity Relation Extraction Based on Improved Attention Mechanism

FENG Jian-zhou1, SONG Sha-sha1, WANG Yuan-zhuo1,2, LIU Ya-kun1, WU Hong-ying1, GONG Hao1   

  1. 1. School of Information Science and Engineering, Yanshan University, Qinhuangdao, Hebei 066000, China;
    2. Institute of Computer Technology, Chinese Academy of Sciences, Beijing 100080, China
  • Received:2017-11-27 Revised:2019-03-22 Online:2019-08-25 Published:2019-08-25

摘要: 实体关系抽取是知识库构建中至关重要的一个环节.在众多的实体关系抽取方法中,远程监督结合神经网络模型的方法在准确率等性能上是比较令人满意的,但远程监督获取的标注语料中往往存在大量的噪声数据,给实体关系抽取模型的训练带来了很大的影响.本文提出一种基于改进注意力机制的卷积神经网络实体关系抽取模型.该模型针对包含同一实体对的句子集合,从中尽可能地找出所有体现该实体对关系的正实例,构建组合句子向量,抛弃可能的噪声句子,从而最大程度地降低噪声句子的影响又能充分利用正实例的语义信息.实验证明,本文提出的关系抽取模型在准确率上优于对比的关系抽取模型.

关键词: 关系抽取, 改进注意力机制, 卷积神经网络, 远程监督, 组合句子特征向量

Abstract: Entity relation extraction is a crucial part of knowledge base construction.Among many methods of relationship extraction,the method of distant supervision combined with neural network model is satisfactory in terms of accuracy and other performance.However,there is often a large amount of noise data in the labeled corpus obtained by distant supervision,which has a great impact on the training of relationship extraction model.In this paper,we propose an entity relationship extraction model of convolutional neural network based on improved attention mechanism.Aiming at the sentence set containing the same entity pair,this model tries to find out all the positive instances that embody the relationship between the entity pair,construct the combined sentence vector,and discard the possible noise sentences,so as to minimize the impact of noise sentences and make full use of the semantic information of positive instances.Experimental results show that the accuracy of the proposed relation extraction model is better than that of the comparative relation extraction model.

Key words: relation extraction, improved attention mechanism, convolutional neural networks, distant supervision, combined sentence feature vector

中图分类号: