韦鹏辉:中国科学院自动化研究所在读博士生,2016年本科毕业于武汉大学。主要研究兴趣为观点挖掘、文本生成和信息检索,曾在ACL、EMNLP、SIGIR、AAAI发表一作论文。
报告题目:端到端的情绪原因分析
报告摘要:情绪原因分析早期的研究工作主要关注于从文档中抽取给定情绪类型/情绪表达子句所对应的原因子句。此类研究工作中,事先给定情绪类型/情绪表达子句这一要求限制了情绪原因分析在实际场景中的应用,因此相关学者后续提出了情绪和原因的联合抽取任务,旨在从文档中成对抽取出 {情绪子句, 原因子句} 而无须事先给定情绪类型,并同时给出了两阶段解法:首先独立地得到情绪子句集合、原因子句集合,两个集合做笛卡尔积得到全部可能的成对后再用二分类器来过滤掉错误的部分。两阶段解法的主要问题在于pipeline模式下固有的错误传递问题,并且其第一阶段在没有情绪的情况下就抽取原因是不合理的。针对两阶段解法的缺陷,近期的研究开始对该问题进行端到端建模,尝试直接从文档中提取出情绪-原因的句对。本次报告将回顾相关研究,并介绍发表于ACL 2020的两篇工作,分别从排序和结构化预测的角度出发来端到端地进行情绪原因分析:其中一篇工作由笔者发表,将信息抽取任务转化为排序问题,基于语篇结构提出了一个简单但有效的句对排序模型;另一篇工作则从结构化预测中转移系统中受到启发而提出一个有向图构建模型。在报告的最后将会给出这一问题的进一步发展思路供读者参考。
Spotlight:
全面回顾情绪原因分析这一研究领域;
介绍两个建模角度不同但都取得优秀性能的端到端情绪原因分析模型;
给出这一领域在未来的可能发展思路。
1. A Text-driven Rule-based System for Emotion Cause Detection
推荐理由:这项工作最早提出了情绪原因识别这一研究问题,并给出了语言学规则驱动的方案。
2. Event-Driven Emotion Cause Extraction with Corpus Construction
推荐理由:这项工作公开了第一个中文情绪原因抽取语料,并提出了基于事件抽取的方法。
3. Who Feels What and Why Annotation of a Literature Corpus with Semantic Roles of Emotions
推荐理由:这项工作将情绪原因分析推广至更精细的情绪语义角色分析,公开了第一个英文语料。
4. Emotion-Cause Pair Extraction A New Task to Emotion Analysis in Texts
推荐理由:这项工作提出了情绪-原因联合抽取这一新任务,并给出了一个两阶段的方案。
5. Effective Inter-Clause Modeling for End-to-End Emotion-Cause Pair Extraction
推荐理由:这项工作将情绪-原因联合抽取转化为排序问题,基于语篇结构提出了一个端到端的句对排序模型。
6. Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction
推荐理由:这项工作将情绪-原因联合抽取转化为有向图构建问题,基于转移系统提出了一个端到端的基于状态转移的模型。
7. GoodNewsEveryone A Corpus of News Headlines Annotated with Emotions, Semantic Roles, and Reader Perception
推荐理由:这项工作进一步研究了情绪语义角色,公开了相应的英文语料。