电子学报 ›› 2022, Vol. 50 ›› Issue (8): 1851-1858.DOI: 10.12263/DZXB.20201463

• 学术论文 • 上一篇    下一篇

SMGN:用于对话状态跟踪的状态记忆图网络

张志昌, 于沛霖, 庞雅丽, 朱林, 曾扬扬   

  1. 西北师范大学计算机科学与工程学院,甘肃 兰州 730070
  • 收稿日期:2020-12-18 修回日期:2021-04-15 出版日期:2022-08-25
    • 作者简介:
    • 张志昌 男,1976年4月出生,甘肃天水人.教授、硕士生导师.1998年、2003年和2010年分别在西北师范大学、西北工业大学、哈尔滨工业大学获工学学士、工学硕士和工学博士学位.研究方向为自然语言处理,主要进行问答技术、医疗文本处理技术研究.E-mail: zzc@nwnu.edu.cn
      于沛霖 男,1996年1月出生,甘肃兰州人.西北师范大学计算机科学与工程学院硕士研究生.研究方向为自然语言处理.E-mail: ypl670335924@gmail.com
    • 基金资助:
    • 国家自然科学基金 (61762081); 甘肃省重点研发计划项目 (17YF1GA016)

SMGN: A State Memory Graph Network for Dialogue State Tracking

ZHANG Zhi-chang, YU Pei-lin, PANG Ya-li, ZHU Lin, ZENG Yang-yang   

  1. College of Computer Science and Engineering,Northwest Normal University,Lanzhou,Gansu 730070,China
  • Received:2020-12-18 Revised:2021-04-15 Online:2022-08-25 Published:2022-09-08

摘要:

对话状态跟踪是任务型对话系统的重要模块.已有研究使用注意力机制模拟图结构来引入历史信息,但这种方法无法显式利用对话状态的结构性.此外,如何生成复杂格式的对话状态也为研究带来了挑战.针对以上问题,本文提出一种状态记忆图网络SMGN(State Memory Graph Network).该网络通过状态记忆图保存历史对话信息,并使用图结构与当前对话进行特征交互.本文还设计了一种基于状态记忆图的复杂对话状态生成方法.实验结果表明,本文提出的方法在CrossWOZ数据集上联合正确率提高1.39%,在MultiWOZ数据集上提高1.86%.

关键词: 任务型对话系统, 对话状态跟踪, 注意力机制, 自然语言处理, 深度学习

Abstract:

Dialogue state tracking is an important module of task-oriented dialogue system. Previous studies exploited the historical dialogue information by attention-based graph structure simulation, but these methods cannot explicitly take advantage of the structure of the dialogue state. In addition, how to generate complex format dialogue states also brings challenges to research. In this paper, we propose a state memory graph network(SMGN). The network saves historical information through the state memory graph, and uses the graph to interact with the current dialogue. We also implement a complex dialogue state generation method based on state memory graph. Experimental results show that the proposed method improves the joint accuracy by 1.39% on the CrossWOZ dataset and 1.86% on the MultiWOZ dataset.

Key words: task-oriented dialogue system, dialogue state tracking, attention mechanism, natural language processing, deep learning

中图分类号: