牛广林:北京航空航天大学在读博士,研究方向为知识图谱与知识推理,以第一作者发表AAAI、EMNLP等多篇论文。
报告题目:自动化学习实体类型表示的知识图谱嵌入方法
报告摘要:由于实体类型比实体具有更高的语义层级,属于常识知识,因此用实体类型信息可以在知识图谱推理的过程中提供更多的语义约束来提高推理精度。本文将知识图谱中实体-关系-实体的三元组扩展到实体类型-关系-实体类型的类型相关的三元组,提出能够自动化学习实体类型表示的AutoETER模型,其不仅能够建模和推理对称、逆反、传递几种不同模式的关系,同时能够解决一对多,多对一和多对多这类复杂关系的推理问题。特别的,论文中提出的AutoETER模型具有一个可适配于任意知识图谱嵌入模型的可插播模块,用于提供实体类型表示并进一步提升原有知识图谱嵌入模型的性能。实验结果验证了本文提出的AutoETER方法的有效性。实验中还给出了可视化分析,可以直观看出实体类型表示的聚类效果明显优于实体表示的聚类效果。
Spotlight:
利用实体类型-关系-实体类型的类型相关的三元组,自动学习实体类型表示。
给出我们的方法能够建模和推理对称、逆反、传递关系的理论证明。
自动化学习实体类型表示的方式具有可插播的特性,可以提升原有知识图谱嵌入模型的性能。
1. Representation Learning of Knowledge Graphs with Hierarchical Types
推荐理由:这篇论文最早在知识图谱嵌入中引入实体的层次类型信息,核心思想是不同类型的实体应具有不同的表示,因此论文中提出的TKRL模型将层次类型看成实体的投影矩阵,并通过设计的层次类型编码器将一个实体不同层次的类型信息进行建模,层次类型提供了更多的语义约束,能够学习到更好的实体和关系的表示,并提升知识图谱补全的效果。
2. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction
推荐理由:为了建模实体天然的层次特性,本文提出的HAKE模型将实体嵌入到极坐标系中,极坐标系中具有相同极径的实体可以反映出层次语义结构,极径较小的实体位于较高的语义层级,极角可以区分层次相同的不同实体。
3. Low-Dimensional Hyperbolic Knowledge Graph Embeddings
推荐理由:知识图谱嵌入需要在嵌入空间中保留知识图谱原有的分层和逻辑模式。对于分层数据,双曲嵌入方法已显示出较好的效果,但是,现有的双曲嵌入方法不能解决知识图谱中丰富的逻辑模式。这篇论文提出了一类双曲知识图谱嵌入模型,该模型同时学习到层次结构和逻辑模式,并将双曲反射和旋转操作结合在一起,能够对复杂的关系模式进行建模。
4. Universal Representation Learning of Knowledge Bases by Jointly Embedding Instances and Ontological Concepts
推荐理由:通常在知识图谱的构建过程中都会给出一个知识图谱的本体层信息,其中包括实体的概念及概念间的关系,这篇论文提出的JOIE模型对本体层和实例层的两个不同视角的知识图谱进行联合嵌入,包括跨视图关联模块将实例与概念进行关联,内部视图模块对实例层和本体层知识图谱分别进行表示学习。
5. Knowledge Graph Embedding Compression
推荐理由:现有的知识图谱嵌入模型通常需要较大维度的嵌入空间,本文通过离散化技术对知识图谱实体嵌入表示进行了压缩,例如原本一个200维的浮点型向量能够被编码为用少量整型数值组成的低维向量,对于大规模知识图谱在极大程度上可以提高嵌入表示的压缩率,减小模型的复杂度。
6. Knowledge Association with Hyperbolic Knowledge Graph Embeddings
推荐理由:这篇论文提出了一种使用新的基于双曲GNN的知识图谱嵌入模型HyperKA来学习知识关联,HyperKA将关系建模为输入层实体向量之间的平移,然后通过邻域的聚合得到更新后的实体嵌入表示,这样可以结合TransE这类基于平移的模型和RGCN这类基于邻域聚合的方法的优点。