论文浅尝 | KRACL-利用图上下文和对比学习的稀疏KG补全

news/2024/11/17 3:25:55/

98c2c06758fbbf4df8daa751f0e8d169.png

笔记整理:李娟,浙江大学博士,研究方向为知识图谱表示学习

论文链接:https://arxiv.org/pdf/2208.07622.pdf

代码链接:https://github.com/TamSiuhin/KRACL

介绍

知识图谱(KG)通常是不完整的,知识表示学习(KGE)方法将知识图谱中实体和关系映射到低维向量空间,通过向量间的计算完成知识图谱补全等任务。下图展示了不同入度值范围下RotatE方法的MRR指标和数据集的实体出现频率统计,说明现有KG存在稀疏性,即KG中大部分实体的入度值较低,且已有KGE方法如RotatE在入度低的实体上预测结果表现较差。针对KG的稀疏性挑战,本文提出通过图上下文和对比学习缓解稀疏问题。

f7d44b5fad5eeb726cc05016453a7832.png

KRACL方法框架如下:

85e13df0937b43e57b9255a1eb0c5c1d.png

方法

主要包括两个模块:

(1)KRAT(知识关系注意力网络):将邻居三元组映射到不同空间使用注意力机制完成聚合,模块捕获了不同上下文三元组的重要性。通过T层KRAT后,模块可捕获多跳上下文。该模块先使用不同的运算符将邻居关系-实体对映射到不同表示空间:

b7e8c6d30c9e08e9fc68130dd47c6f6e.png

再将消息组合得到聚合消息:

756c965bff1bcc9a432d66620398c1e4.png

然后计算注意力分数:

a77255331fb80501da7483e50dde8d18.png

b16bd6fe80d329c9d1607c3fd2f44af5.png

最后通过注意力机制聚合所有上下文信息,实体更新计算为:

05870ee5eb9d4b194ff0ff5bd0ead574.png

关系更新计算为:

6e43115502c84bf8bf20953906ec41cb.png

通过KRAT获取实体和关系表示后输入ConvE计算预测损失:

3036235d8ffb5be0a9f847fc9cc76897.png

(2)KCL(知识对比损失):对比损失引入了更多负样本,丰富对稀疏实体的反馈。对比损失的计算为:

914d21db384db748349f024c57144530.png

其中实体的正样本为实体本身及实体的邻居实体-关系对,负样本为除了实体外的其他实体。模型最终的损失函数定义为两部分损失之和:

53ae3f9c5df7c68f8cdaea4de9a0c6cc.png

实验

本文在稀疏数据集WN18RR和NELL-995,以及稠密数据集FB15K237和Kinship上完成了链接预测实验,证明了方法的有效性:

ce7ad5ca649c0dd4a6f43e848a86302d.png

f967cab4ec8fecfc22321154067b1475.png

统计了不同入度范围实体的预测结果,KRACL对稀疏实体效果的提升明显:

f60d3633d35830e82212f13819703ff6.png

为进一步验证方法对稀疏性的缓解,统计了不同百分比训练集时模型的预测结果:

8871e75e557c81a7d07954728882850c.png

同时,本文还评估了不同GNN方法结合不同变换操作的效果验证了KRACL的有效性,通过消融实验验证了模块的有效性,以及通过在噪声数据集的预测结果验证了KRACL的鲁棒性。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

c695c55f12b5ab91275d09f945c0472f.png

点击阅读原文,进入 OpenKG 网站。


http://www.ppmy.cn/news/1043163.html

相关文章

optee读取Arm系统寄存器的模板

先写一个通用的内联函数模板,然后再通过宏控来定义各种读写函数。 (core/arch/arm/include/arm64.h)/** Templates for register read/write functions based on mrs/msr*/#define DEFINE_REG_READ_FUNC_(reg, type, asmreg) \ sta

Php“牵手”lazada商品详情页数据采集方法,lazadaAPI接口申请指南

lazada详情接口 API 是开放平台提供的一种 API 接口,它可以帮助开发者获取商品的详细信息,包括商品的标题、描述、图片等信息。在电商平台的开发中,详情接口API是非常常用的 API,因此本文将详细介绍详情接口 API 的使用。 一、la…

【实现Element表单区间输入框】

思路:两个输入框组合而成的,绑定的是数组的第一项和第二项、搭配自定义正则从而实现的区间输入框 效果 核心代码 页面部分传递给组件的数据上部分核心之外还需给组件一个默认值dataform: {interval: [],}, interval数组的第一项绑定的第一个区间&#…

【支付宝小程序】支付宝小程序自定义组件技术教程

🦖我是Sam9029,一个前端 Sam9029的CSDN博客主页:Sam9029的博客_CSDN博客-JS学习,CSS学习,Vue-2领域博主 **🐱‍🐉🐱‍🐉恭喜你,若此文你认为写的不错,不要吝啬你的赞扬&#xff0c…

激光雷达 01 线数

一、线数 对于 360 旋转式和一维转镜式架构的激光雷达来说,有几组激光收发模块,垂直方向上就有几条线,被称为线数。这种情况下,线数就等同于激光雷达内部激光器的数量[参考]。 通俗来讲,线数越高,激光器的…

从零开发短视频电商 自动化测试WebUI端到端测试-Playwright

文章目录 Playwright是什么Playwright入门示例添加Maven依赖示例代码启动验证 功能自动等待内置Web断言可视化UI模式减慢操作截图录屏脚本录制 高级识别验证码 Playwright是什么 https://playwright.dev/ https://playwright.dev/java/ Playwright为现代 Web 应用程序提供可…

搭建redis集群

前言 redis 集群分为一下几种: 【主从模式】:一般情况大多都是读多写少的情况,主从模式可以将读写分离,主库写,从库只负责读取的情况,这从如果任何一个从库宕机的情况,整个集群仍然可以提供工作…

typeof与instanceof的区别

最近又用到了对一个类型进行类型判断,这里对两种判断方法进行一个总结 相同点: typeof与instanceof都是判断数据类型的方法 区别: typeof会返回一个变量的基本类型(特殊 typeof null 会为object 但这只是JavaScript 存在的一个…