左新宇:中国科学院自动化研究所毕业博士,主要研究方向自然语言处理、信息抽取、事件关系抽取,现已在ACL、COLING、SCIENCE CHINA、CCL等国内外NLP领域期刊会议发表文章6篇。
报告题目:知识融合的事件因果关系数据增强方法
报告摘要:我们提出一个知识增强的事件因果关系数据自动标注框架,该框架利用多个外部知识库,引入大量的高概率因果相关事件,基于距离监督的方式从外部无标注文本中自动标注含噪的训练数据,并利用常识推理资源库过滤噪声数据,最终使用自训练机制利用自动标注的训练数据提升事件因果关系识别的性能。此外,自动标注的训练数据的质量相对不高,因此,还提出一个知识引导的事件因果关系数据生成框架,该框架利用对偶学习机制,基于引入的因果相关事件,将事件因果关系识别器和数据生成器对偶约束,生成高质量的训练数据,提升事件因果关系识别的性能。在国际公开的数据集上的实验结果表明新生成的训练数据可以有效提升事件因果关系识别的性能。
论文题目:KnowDis: Knowledge Enhanced Data Augmentation for Event Causality Detection via Distant Supervision
分享亮点:
1、提出知识融合的事件因果关系数据增强方法,从多个外部知识库中抽取因果相关事件,并生成表达因果相关事件因果语义的新训练数据;
2、设计了知识增强的事件因果关系数据自动标注框架,利用远距离监督的方式,基于知识库中获取的因果相关事件,在外部无标注文本中自动回标得到新训练数据;
3、设计了知识引导的事件因果关系数据生成框架,利用对偶学习机制,将事件因果关系识别器和数据生成器对偶约束,从识别过程中学习如何生成任务相关的新句子,从生成过程中学习如何更准确地理解因果语义学习,生成高质量表达事件因果语义的新训练数;
4、基于两个常用公开数据集,评估生成的新训练数据对于事件因果关系识别任务的有效性。
1. Modeling Document-level Causal Structures for Event Causal Relation Identification
推荐理由:基于文档主体结构识别文档级别事件间的因果关系,是该任务近两年关注度较高的文章。
2. Knowledge Enhanced Event Causality Identification with Mention Masking Generalizations
推荐理由:第一篇尝试将外部知识融入事件因果关系识别任务中的工作。
3. ATOMIC An Atlas of Machine Commonsense for If-Then Reasoning
推荐理由:现常用的事件相关常识推理资源。
4. EDA Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks
推荐理由:现常用的一种简单的文本分类任务数据增强方法。
5. The Event StoryLine Corpus A New Benchmark for Causal and Temporal Relation Extraction
推荐理由:现事件因果关系识别任务常用公开数据集。
6. Exploring Pre-trained Language Models for Event Extraction and Generation
推荐理由:基于生成式方式抽取事件。