知识图谱:浙江大学教授 陈华军
知识图谱 1课时
http://openkg.cn/datasets-type/
知识图谱的价值
知识图谱是有什么用?
-
语义搜索
-
问答系统
- QA问答对
- 知识图谱:结构化图
-
辅助推荐系统
-
大数据分析系统
-
自然语言理解
-
辅助视觉理解
例子:
知识图谱的技术内涵
login graph
pure graph
format graph
知识图谱技术要素
- 表示
- 存储
- 抽取
- 融合
- 推理
- 问答
- 分析
- 其他
基于图的知识表示
- 有向标记图(Directed-Labled Graph)–最简单、最接近自然语言和人脑认知的数据模型
RDF代表Resource Description Framework(资源描述框架)
三元组表示: 主题:关系:对象
图数据存储与查询
图数据库充分利用图的结构建立微索引,这种微索引比起关系数据库的全局索引
在处理图遍历查询时更加廉价,其查询复杂度与数据集整体大小无关,仅正比于
相邻子图的大小。因此在很多涉及复杂关联和多跳的场景中得到广泛应用
图知识库不是知识图谱的必选方案
知识抽取
完全抽取高质量的知识无法做到,机器抽取+ 人工众包目前是构建知识构建的主流技术路线。
知识图谱融合
多个来源的数据实体或概念隐射到统一的命名空间。
两个层面:
- 本体概念层面:多个知识图谱中,同个本体的父子类关系融合
- 实体层面: 同一个人,在不同数据集有不同的名称。
基于表示的方法 是当前实现知识图谱异构融合的主流技术
推理
目标:使用知识图谱中已知的关联关系或事实来推断位置的关系和事实
基于符号的推理方法:
具备可解释性。不易于处理隐含和不确定的知识
基于表示学习的方法:
主要优点:推理i效率高,能处理隐含的知识,但丢失了可解释性
问答
图算法和图神经网络
总结:建立知识图谱的系统工程观
- 数据-》算法-》工具-》形成系统