知识图谱:知识的表示方法

ops/2024/9/23 0:04:32/

知识表示指的是存储在知识图谱中的数据使用何种语言或者何种数据结构进行描述,从而能够使得知识图谱中的知识运算更加快捷高效。知识表示的方式主要可分为三种,一种是以三元组的形式对知识进行表示,一种是以图结构的形式对知识进行表示,还有一种是以向量的形式对知识进行表示。

(1)RDF三元组形式表示

从数据结构的角度来看,可以把知识图谱视为一个由节点与边组成的图形结构,其中节点代表一个类、概念、属性值或实体,边代表节点之间的关系。W3C制定了三种主流的技术标准用于描述由节点与边组成的图形逻辑,分别是RDF、RDFS、OWL,它们均把三元组作为底层基本的数据结构。

(2)图结构数据形式表示

由节点与边组成的RDF三元组本质上就是图结构数据,但基于RDF、RDFS或OWL标准的三元组所构建的知识图谱过于复杂,查询效率比较低,实际上不如基于图数据库的构建方便好用。图数据库舍弃了RDF、RDFS、OWL等本体定义标准中对于实体分类的复杂定义,仅用节点与边这种图结构来存储链接数据,因此在查询效率上图数据库相比于三元组数据库速度更快,这也是本文使用Neo4j图数据库取代Jena三元组数据库存储学术数据的主要原因之一。

(3)向量形式表示

近年来随着计算机运算能力的不断升级,神经网络重新走进公众的视野,又一次掀起了人工智能时代的浪潮。随着NLP自然语言处理中词向量嵌入技术的流行,人们开始使用低维稠密的向量来表示知识。对于知识图谱三元组中的主语、谓语和宾语使用词嵌入(WordEmbedding)技术转为初始的低维向量,然后将这些向量作为数据源输入到神经网络,通过不断地学习训练最终获得实体和关系在低维向量空间中的投影向量。使用向量进行知识表示为知识推理带来了新的启发,人们根据向量间的加减乘除四则运算获取到新的事实与关系向量,并且能够得到一些隐藏的事实与依据,因为这些隐藏的事实通常在现实中是不易被察觉、被人们主观所忽略的,通过向量空间内的逻辑运算才得以被发现。


http://www.ppmy.cn/ops/18058.html

相关文章

streampetr原版网络nuscenes数据pkl文件中的各字段含义

streampetr原版网络nuscenes数据pkl文件中的各字段含义 每帧数据都包含下列的信息 "token": 该帧数据的标识,具有唯一性 "prev": 该帧数据上一帧数据的token,如果没有就为"" "next": 该帧数据下一帧数据的toke…

通过前端js获取指定年周的开始时间与结束时间(以周一为开始时间)

入参格式:年-周 //截取:具体看入参格式 let year2024; let week2; let weekStartDatenew Date(); let weekEndDatenew Date(); // 创建一个Date对象,设置为指定年份的第一周的周日 let date new Date(year, 0, 1); // 年份, 月份(0…

又重新搭了个个人博客

哈喽大家好,我是咸鱼。 前段时间看到一个学弟写了篇用 Hexo 搭建博客的教程,心中沉寂已久的激情重新被点燃起来。(以前搞过一个个人网站,但是因为种种原因最后不了了之) 于是花了一天时间参考教程搭了个博客网站&…

以太网口硬件知识分享

一、了解网口通信基本原理 实现网络通信实质上是PHY与MAC及RJ45接口实现信号传输。MAC 就是以太网控制器,MAC属于数据链路层,主要负责把数据封装成帧,对帧进行界定实现帧同步。对MAC地址和源MAC地址及逆行相应的处理并对错误帧进行处理。PHY…

jquery html(““)造成内存上涨

在 jQuery 中,使用 html("") 来清空元素的内容是一种常见的做法。然而,如果不慎用,这可能导致内存使用不当上升,尤其是在涉及到大量的 DOM 操作和事件处理器时。问题通常发生在直接或间接创建了大量的 DOM 元素&#xf…

Mudem,打造私密安全、高效稳定的私人空间

Mudem 是 Codigger 平台中的一个关键组件,它提供基础通讯服务,确保不同类型的机器之间可以进行安全和高效的连接。它其设计理念在于将本地机器、公有云以及私有云上的设备无缝地整合为一个可远程在线访问的工作站(Workstation)。这…

leetcode2739--总行驶距离

1. 题意 典型的空瓶换酒问题。 2. 题解 2.1 直接模拟 class Solution { public:int distanceTraveled(int mainTank, int additionalTank) {int ans 0;while (mainTank > 5) {ans mainTank/5*5;int extra min(mainTank/5, additionalTank);mainTank % 5;mainTank e…

Pandas 2.2 中文官方教程和指南(二十一·三)

部分字符串索引 可以将日期和解析为时间戳的字符串作为索引参数传递: In [100]: ts["1/31/2011"] Out[100]: 0.11920871129693428In [101]: ts[datetime.datetime(2011, 12, 25):] Out[101]: 2011-12-30 0.56702 Freq: BME, dtype: float64In [102]…