电子学报 ›› 2022, Vol. 50 ›› Issue (9): 2242-2264.DOI: 10.12263/DZXB.20220212

• 综述评论 • 上一篇    下一篇

面向知识库问答的问句语义解析研究综述

仇韫琦1,2, 王元卓1,3(), 白龙2,4, 尹芷仪1, 沈华伟1,2, 白硕1   

  1. 1.中国科学院计算技术研究所数据智能系统研究中心,北京 100190
    2.中国科学院大学计算机科学与技术学院,北京 101408
    3.中科大数据研究院,河南 郑州 450046
    4.中国科学院计算技术研究所网络数据科学与技术重点实验室,北京 100190
  • 收稿日期:2022-03-02 修回日期:2022-05-11 出版日期:2022-09-25
    • 通讯作者:
    • 王元卓
    • 作者简介:
    • 仇韫琦 男,1994年出生.中国科学院计算技术研究所博士研究生.主要研究方向为知识库问答、语义解析.E-mail: qiuyunqi19b@ict.ac.cn
      王元卓 男,1978年出生.博士.中国科学院计算技术研究所研究员,博士生导师,中科大数据研究院院长.主要研究方向为网络大数据分析、开放知识计算、社交网络演化计算.
      白龙 男,1993年出生.中国科学院计算技术研究所博士研究生.主要研究方向为知识图谱、事件预测.E-mail: bailong18b@ict.ac.cn
      尹芷仪 女,1982年出生.博士.中国科学院计算技术研究所高级工程师,硕士生导师.主要研究方向为社会计算、网络空间安全.E-mail: yinzhiyi@ict.ac.cn
      沈华伟 男,1982年出生.博士.中国科学院计算技术研究所研究员,博士生导师,数据智能系统研究中心主任.主要研究方向为网络数据挖掘、社交网络分析、图神经网络.E-mail: shenhuawei@ict.ac.cn
      白硕 男,1956年出生.博士.中国科学院计算技术研究所研究员,博士生导师,恒生电子股份有限公司首席科学家.E-mail: bshuo@sina.cn
    • 基金资助:
    • 国家自然科学基金 (62172393); 中原英才计划-中原科技创新领军人才项目资助 (204200510002)

A Survey of Question Semantic Parsing for Knowledge Base Question Answering

QIU Yun-qi1,2, WANG Yuan-zhuo1,3(), BAI Long2,4, YIN Zhi-yi1, SHEN Hua-wei1,2, BAI Shuo1   

  1. 1.Research Center for Data Intelligence Systems,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China
    2.School of Computer Science and Technology,University of Chinese Academy of Sciences,Beijing 101408,China
    3.Big Data Academy,Zhongke,Zhengzhou,Henan 450046,China
    4.CAS Key Laboratory of Network Data Science and Technology,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China
  • Received:2022-03-02 Revised:2022-05-11 Online:2022-09-25 Published:2022-10-26
    • Corresponding author:
    • WANG Yuan-zhuo

摘要:

知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的问句映射为结构化的语义表征,再将其改写为知识库查询获取答案.目前,面向知识库问答的语义解析方法主要面临三个挑战:首先是如何选择合适的语义表征形式以表达问句的语义,然后是如何解析问句的复杂语义并输出相应的语义表征,最后是如何应对特定领域中数据标注成本高昂、高质量数据匮乏的问题.本文从上述挑战出发,分析了知识库问答中常用的语义表征的特点与不足,然后梳理现有方法并总结分析其如何应对问句的复杂语义,接着介绍了当前方法在标注数据匮乏的低资源场景下的尝试,最后展望并讨论了面向知识库问答的语义解析的未来发展方向.

关键词: 知识库, 问答, 语义表征, 语义解析, 低资源

Abstract:

Knowledge base question answering(KBQA) provides accurate and short answers to complex factoid questions with the help of high-precision and highly relevant structured knowledge in the knowledge base(KB). Semantic parsing has become one of the mainstream methods of KBQA. Under the given form of question meaning representation, this kind of method maps unstructured questions into structured meaning representations, and then rewrites them as KB queries to obtain answers. At present, semantic parsing for KBQA mainly faces three challenges: first how to choose a suitable meaning representation form to express the semantics of questions, then how to parse the complex semantics of questions and output the corresponding meaning representations, and finally how to deal with the high cost of labeling datasets and the lack of annotated data in specific domains. Starting from the above challenges, this paper first analyzed the characteristics and shortcomings of meaning representations commonly used in KBQA and then combed out how existing methods deal with the complex semantics of questions. After that, this paper introduced the current attempts in low-resource scenarios and finally discussed the future directions of semantic parsing for KBQA.

Key words: knowledge base, question answering, meaning representation, semantic parsing, low resource

中图分类号: