刘乾:北京航空航天大学与微软亚洲研究院联合培养博士,主要研究方向为对话系统中的语义解析(将文本解析成SQL语言),目前已在AAAI与EMNLP等会议上发表论文3篇。
报告题目:一种基于拆分与重组的上下文改写方法
报告摘要:对话系统中的语义解析是一项重要而具有挑战性的任务,其中一大挑战就是相关训练语料的不足。而近些年语义解析领域在飞速发展,这启发我们将对话系统中的语义解析任务拆解为两个子任务:上下文重写和语义解析。子任务一旨在改写对话中的语句,从而消解其指代,补充其省略内容;子任务二则可以直接利用一个已经训练好的上下文无关的语义解析器,来生成对话对应的SQL语句。本篇论文主要聚焦在第一个任务上,为了完成这个任务,我们提出了一种新颖的基于拆分与重组两个阶段的强化学习方法。不同于直接利用原始语句生成改写句,这种方法引入span作为改写的基本单位,再利用span间的语义冲突重组生成改写句。在FollowUp数据集上进行的实验表明,我们方法的性能远远超过CopyNet,端到端指代消解网络等强大的基线模型。除此之外,我们还将在SQA数据集上探索了我们提出方法的可扩展性。
Spotlight:
1、提出结合上下文改写与上下文无关的语义解析器完成对话中语义解析的任务;
2、为上下文改写引入一种中间表示,极大地提升了上下文改写的性能;
3、介绍的基于强化学习的方法是普适的,有较大可扩展性。
1. Incorporating Copying Mechanism in Sequence-to-Sequence Learning
推荐理由:这篇论文非常出名,由于上下文改写任务本身的特殊性,一般生成的语句与原始句子有很大部分的重叠,所以带有复制机制的网络(CopyNet)非常适合应用在此任务中。
2. Unsupervised Context Rewriting for Open Domain Conversation
推荐理由:除了语义解析领域外,常见的还需要上下文改写的场景还包括开放领域的聊天机器人。这篇论文旨在无监督地生成上下文改写训练语料,并以此提升下游任务的精度。
3. Learning to Map Context-Dependent Sentences to Executable Formal Queries
推荐理由:这篇论文是一篇典型的用端到端的方式训练对话系统中语义解析器,也是NAACL2018的Outstanding Paper。与我们论文场景不同的是,这篇论文面向的是单领域的语义解析任务,而我们的论文面临的是跨领域的语义解析任务。