导图社区知识库导论图谱

知识库导论图谱

知识库导论图谱的思维导图，如何制作知识图谱？知识图谱是一种知识的表达形式，能够帮助机器变得更聪明，让人工智能更智能。

提示: 本内容由社区用户上传并分享。平台不对内容的真实性、合法性、知识产权归属及是否侵害第三方权利进行事前审核或保证。本内容可能包含受版权保护的图片、字体或其他第三方素材，使用前请自行确认授权范围。

编辑于2023-08-07 16:33:27 山东省

大盗贼

他的近期作品查看更多>>

知识库导论图谱
知识库导论图谱的思维导图，如何制作知识图谱？知识图谱是一种知识的表达形式，能够帮助机器变得更聪明，让人工智能更智能。

知识库导论图谱

社区模板帮助中心，点此进入>>

大盗贼

他的近期作品查看更多>>

知识库导论图谱
知识库导论图谱的思维导图，如何制作知识图谱？知识图谱是一种知识的表达形式，能够帮助机器变得更聪明，让人工智能更智能。

相似推荐
大纲

互联网9大思维
- 41.8k
- 984
- 2.5k
- 403
- 0
MindMaster
组织架构-单商户商城webAPP 思维导图。
- 20.0k
- 3
- 187
- 8
- 1
Kacyun
域控上线
- 5.5k
- 171
- 11
- 4
- 0
jackrao
python思维导图
- 11.3k
- 560
- 243
- 6
- 0
(*^▽^*)
css
- 4.9k
- 1
- 43
- 3
- 0
A张舫
CSS
- 7.6k
- 272
- 189
- 33
- 0
journey
计算机操作系统思维导图
- 9.6k
- 361
- 210
- 15
- 0
journey
计算机组成原理
- 5.0k
- 98
- 71
- 8
- 0
journey
IMX6UL(A7)
- 3.5k
- 41
- 5
- 0
- 0
Handler XU
考试学情分析系统
- 4.8k
- 51
- 10
- 1
- 0
蒋龙

知识图谱导论

全文总结

信息量和指导性非常大

首先思考一个问题，如何将自己脑中的知识表示出来，并且如何让其他人看懂？

Q.什么是知识图谱？

解释：人类在实践中认识客观世界（包括人类自身）的成果。（经验、理论知识）

机器方面：知识图谱中的知识是机器在实践中认识客观世界的成果，机器如何像人类一样去认识客观世界的成果？

人类视角：人类是如何去学习知识的，e.g.文字、语言（

知识的表达形式，中介），知识本身对于人类和机器是平等的：比如说，我长得很帅（人类的方式）机器视角：不理解“我长得很帅”这句话，需要将它表达成机器能理解的形式（向量化的表示和神经网络），机器有适合它的理解和表达知识的形式；

知识图谱就是一种适合于机器的知识的表示形式；严格定义是：

知识图谱本质上是一种结构化的知识表示形式，它是利用图结构建模、识别、和推断事物之间的复杂关联和沉淀领域知识，因为结构化数据更容易被计算机处理，而图结构能够表达更加丰富的语义和知识。

Q.知识图谱有什么用？

问题：人工智能不够智能（e.g.马云对秘书说：中午帮我买肯德基）

人的视角：对于知识的理解和表达能力是非常强的

机器聪明是一样的道理，知识图谱可以让机器变得更聪明

Q.知识图谱怎么实现？

如何制作知识图谱？

1）获取知识：人类理解的知识制作成机器能理解的知识；

实体识别：类似于分类问题（时间、地点、任务）

关系抽取：找到实体或者说元素之间的联系（e.g.中国人学英语，只懂单词不懂意思）

总结：知识图谱是一种知识的表达形式，能够帮助机器变得更聪明，让人工智能更智能。

第一章，知识图谱的概述

总结

知识点

1. 知识图谱的起源

1945年，美国首任总统科学顾问Vannevar Bush曾提出了一个称为MEMEX的“记忆机器”的设想。他认为人的记忆偏重关联，而非像图书馆那样采用严格的层次分类目录组织大脑中的信息。因此，他提出设计一种Mesh关联网络来存储电子化的百科全书。

2. 语言与知识的关系

人工智能的流派——连接主义、符号主义

连接主义：主张人工智能的实现应该模拟人脑的生理结构，即用计算机模拟人脑的神经网络连接（深度神经网络）；

符号主义：主张只能的实现应该模拟人类的心智，即用计算机符号记录人脑的记忆，表示人脑中的知识（知识工程与专家系统）。

认知智能——语言理解、知识的表示与处理。

知识工程与专家系统——建立一个系统，能够从专家大脑里获取知识，再通过一个推理引擎为非专家用户提供服务，如辅助诊断、判案等。而这个从人脑获取知识的过程就叫作知识工程。

通过机器来理解文本中的知识——抽取技术、语言预训练

抽取技术：例如从文本中识别实体、关系和逻辑等；

语言预训练：通过大量的文本语料训练一个神经网络大模型，文本中的知识被隐含在参数化的向量模型中，而向量化的表示和神金网络对机器是友好的。

知识图谱的本质——旨在利用图结构建模、识别和推断事物之间的复杂关联关系和沉淀领域知识

随着表示学习和神经网络的兴起，人们发现数值化的向量表示更易于捕获那些隐藏的、不易于明确表示的知识，并且比符号表示更易与机器处理。知识图谱同时拥抱机器的符号表示和向量表示，并能将两者有机地结合起来，解决搜索、问答、推理和分析等多方面的问题。

3. 知识图谱的技术内涵

知识图谱核心的技术基因——知识的视角、图的视角

知识的视角：来源于传统AI的知识表示和推理领域，关心怎么表示概念和实体，怎样刻画它们之间的关系，怎样进一步表示公理、规则等更加复杂的知识。

图的视角——来源于知识图谱的互联网基因，关心图中的节点、边、链接、路径、子图结构，怎样存储大规模的图数据，怎样利用图的结构对图数据进行推理、挖掘与分析等。

技术栈——表示、存储、抽取、融合、推理、问答、分析

表示：属性图表示、RDF图模型、OWL本体表示、规则知识建模

存储：关系数据库存储、原生图存储、图查询语言

抽取：从文本中抽取概念、识别实体、抽取三元组和事件

融合：实现本体映射和概念匹配、实例层的实体对齐

推理：基于传统符号逻辑的推理技术、基于表示学习和神经网络的推理技术

分析：传统的图算法、利用图嵌入、图神经网络等技术对知识图谱数据进行深度挖掘和分析

others：知识图谱的众包技术、计算机视觉领域的Scene Graph的构建、Semantic IoT

第二章，知识图谱的表示

总结

知识点

2.1什么是知识表示

知识表示——用易于计算机处理的方式来描述人脑知识的方法

符号表示与向量表示

符号表示：主要缺点是不易于刻画隐式的知识，同时因为推理依赖于知识描述的精确性，比如一个字符串表示稍有错误就无法完成推理，因而传统的符号人工智能研究的很多推理机都没有得到大规模的实用；

向量表示：好处是易于捕获隐式的知识，还可以将推理过程转化为向量、矩阵或张量之间的计算。缺点是丢失了符号表示的可解释性

2.2人工智能历史发展长河中的知识表示

描述逻辑——一阶谓词逻辑的可判定子集，主要用于描述本体概念和属性，对于本体知识库的构建提供了便捷的表达形式。核心要素包括：概念（Concepts）、关系（Relations）、个体（Individuals）。一个由描述逻辑实现的知识库通常包括两个部分。即：TBox和ABox，TBox包含内涵知识，用于描述概念的一般性质。ABox包含外延知识，描述领域中的特定个体。

霍恩规则逻辑——也是一阶谓词逻辑的子集，主要特点是表达形式简单、复杂度低，易于描述规则性知识（如Prolog），核心表达要素：原子（Atom）、规则（Rules）、事实（Facts）。

这类以谓词逻辑为基础的知识表达方式的主要优点是接近自然语言，易于表示精确知识，易于精确实现，主要缺点是无法表达不确定性知识。

产生式系统——专家系统多数是基于产生式系统，核心表达式是 IF P THEN Q CF = [0,1],其中P是产生式的前提，Q是一组结论或操作，CF（Certainty Factor）为确定性因子，也称置信度。

自然性：采用了人类常用的表达因果关系的知识表示形式

模块性：产生式系统中的规则形式相同，易于模块化管理

有效性：能表示确定性知识、不确定知识、启发性知识、过程性知识等

清晰性：产生式有固定的格式

缺点：效率不高、不能表达结构性知识。

框架系统——认为人们对现实世界中事物的认识都是以一个类似于框架的的机构存储在记忆中，当面临一个新事物时，就从记忆中找出一个合适的框架，并根据实际情况对其细节加以修改、补充，从而形成对当前事物的认识。（和面向对象的思想比较像）。

优点：对知识的描述比较全面和完整、知识库的质量也比较高、允许数值计算；

缺点：维护成本高、质量要求高、表达形式不灵活。

语义网络——一种结构化的知识表示方法

优点：与自然语言的转换比较容易实现

缺点：没有公认的形式表达体系

总结

这些方法有一个共同的缺点——知识的获取过程主要依靠专家和人工，越复杂的知识表示框架，知识获取越困难。

2.3知识图谱的符号表示方法

属性图

属性图是由顶点（Vertex）、边（Edge）、标签（Label）、关系类型和属性（Property）组成的有向图，顶点也成为节点（Node），边也称为关系（Relationship），在属性图中，节点和关系边是最重要的表达要素，节点上包含属性，属性可以以任何键值形式存在。

优点：表达方式非常灵活

缺点：缺乏工业标准规范的支持

RDF图模型

基本组成单元是一个三元组，即(s,p,o)，多个三元组头尾相互连接，就形成了一个RDF图

OWL本体语言

OWL在RDF的基础上增加了更多的语义表达构件

总结

属性图是工业界最常用的图谱构件方法，对比如下：

属性图——利用图结构特点做了性能优化，实用度高，但是不支持推理

RDF——更严格的语义逻辑基础，支持推理，并兼容OWL

OWL——提供了更多的语义表达构件

2.4知识图谱的向量表示方法

词向量

传统的如one-hot Encoding的空间消耗比较大，且无法有效地表示词的语义。分布式语义,大概意思就是词的语义可以由它的上下文来确定，通过捕获词的上下文进行分析语义。

实体向量

应该是把三元组的中的实体类比成词

学习模型

TransE：给定一个三元组<h,r,t>，事实存在，则h+r=t.（加法、向量）

DistMult：给定一个三元组<h,r,t>，事实存在，则h*r=t.（乘法、r是矩阵）

第三章,知识图谱的存储与查询

总结

原生图存储在复杂关联查询和图计算方面有性能优势，非原生图存储兼容已有工具集，通常学习和协调成本会低，其次，需要区分RDF图存储和属性图存储：RDF存储一般支持推理，属性图存储通常具有更好的图分析性能优势，此外，在大规模处理情况下，需要考虑与底层大数据存储引擎和上层图计算引擎集成需求

知识点

3.1基于关系数据库的知识图谱存储

分类——基于关系数据库的、基于原生图的