导图社区 知识图谱
关于知识图谱的基本框架结构的总结
编辑于2019-07-30 06:23:56起源
数据
信息
知识
I. 前知识工程(1950-1970)
符号主义和连结主义
1.
2. 子主题
II. 专家系统(1970-1990)
“知识库+推理机”
III. 万维网1.0(1990-2000)
人工构建大规模知识库
IV. 群体智能2.0(2000-2006)
关联知识
V. 知识图谱(2006-至今)
智能应用
i. 知识融合
ii. 语义搜索与推荐
iii. 问答与对话系统
iv. 大数据分析与决策
知识图谱技术
1. 知识图谱构建
I. 知识表示与建模
i. 知识表示
现实世界的可计算模型
ii. 知识图谱的表示方法
A. 基于符号
a. RDF
基于符号语义表示模型
b. RDFS
增加构造类和属性的层次体系
c. OWL
扩展类和属性约束的表示能力
B. 基于向量
a. 翻译模型
a.1. TransE
a.2. TransH
a.3. TransR
a.4. TransD
a.5. TranSparse
b. 组合模型
b.1. RESCAL
b.2. LFM
b.3. DisMult
b.4. HolE
c. 神经网络模型
c.1. SME
c.2. SLM
c.3. NTN
c.4. MLP
c.5. NAM
iii. 常见知识库
A. 早期知识库
a. WordNET
词典知识库,主要用于词义消歧
b. ConceptNET
常识知识库
B. 语义网与知识图谱
a. 互联网众包
b. 专家协作
c. 互联网挖掘
知识库
Freebase
DBPedia
Schema.org
Wikidata
iv. 总结
平衡符号逻辑的表示能力和表示学习模型的复杂性
II. 知识表示学习
i. 任务定义、目标和研究意义
A. 基于网络形式的知识表示难题
a. 计算效率问题
b. 数据稀疏问题
B. 知识表示学习对实体和关系的分布式表示
a. 显著提高计算效率
b. 有效缓解数据稀疏
c. 实现异质信息融合
ii. 研究内容和关键科学问题
A. 复杂关系建模
B. 多源信息融合
C. 关系路径建模
iii. 技术方法和研究现状
A. 复杂关系建模
基于向量的知识图谱表示模型是该结构模型的相关方法
B. 多源信息融合
改善数据稀疏,DKRL模型
a. CBOW
b. 卷积神经网络
C. 关系路径建模
基于知识库的自动问答(PTransE)
iv. 技术展望与发展趋势
A. 面向不同知识类型的知识表示学习
a. 树状关系
表示实体间的层次分类关系
b. 二维网格关系
表示现实世界的空间信息
c. 单维顺序关系
表示实体间的偏序关系
d. 有向网络关系
表示实体间的关联或因果关系
B. 多源信息融合的知识表示学习
a. 融合知识库中实体和关系的其他信息(层次类型、描述文本等)
b. 融合互联网文本、图像、音频、视频等信息
c. 融合多知识库信息
C. 考虑复杂推理模式的知识表示学习
D. 面向大规模知识库的在线学习和快速学习
E. 基于知识分布式表示的应用
利用表示学习在信息融合上的优势,实现跨领域、跨语言的知识库融合
III. 实体识别与链接
识别文本中指定类别实体并与知识库中实体链接
i. 任务定义、目标和研究意义
识别文本中的实体,并将文本中的实体名指向其所代表的现实世界实体的任务
ii. 研究内容和挑战问题
A. 实体名的歧义性和多样性
B. 资源缺乏问题
C. 实体开放性问题
iii. 技术方法和研究现状
A. 传统统计模型方法
B. 深度学习方法
C. 文本挖掘方法
iv. 技术展望与发展趋势
A. 融合先验知识的深度学习模型
B. 资源缺乏环境下的实体分析技术
C. 面向开放域的可扩展实体分析技术
a. 数据规模上的可扩展性
b. 数据源类型上的可扩展性
c. 领域的可扩展性
d. 上下文的可扩展性
IV. 实体关系学习
自动从文本中检测或识别出实体间的某种语义关系
i. 任务定义、目标和研究意义
A. 大规模知识图谱的自动构建
B. 为其它信息获取技术提供支持
C. 自然语言理解
ii. 研究内容和挑战问题
A. 关系抽取的核心研究内容
a. 限定域关系抽取
b. 开放域关系抽取
B. 关系抽取三个挑战
a. 自然语言表达的多样性
b. 关系表达的隐含性
c. 实体关系的复杂性
iii. 技术方法和研究现状
A. 限定域关系抽取
B. 开放域关系抽取
C. 基于规则的关系抽取
D. 基于机器学习的关系抽取
a. 无监督关系抽取
b. 有监督关系抽取
c. 弱监督关系抽取
iv. 技术展望与发展趋势
A. 面向开放域的可语义化的关系抽取技术
B. 篇章级的关系抽取
C. 具有时空特性的多元关系抽取
V. 事件知识学习
将非结构化文本中自然语言所表达的事件以结构化形式展现
i. 任务定义、目标和研究意义
事件识别和抽取研究如何从描述事件信息的文本中识别并抽取出事件信息并以结构化的形式展现出来
A. 任务定义
a. 事件描述
b. 事件触发词
c. 事件元素
d. 元素角色
e. 事件类型
B. 公开评测和数据集
a. 事件识别和抽取
a.1. 公开评测
a.2. 数据集
b. 事件检测与追踪
ii. 研究内容和关键科学问题
A. 认知层面
事件具有复杂的内部结构
B. 语言层面
事件的表诉是灵活的、具有歧义的
C. 方法层面
事件抽取会遇到错误累积的问题
D. 语料层面
标注语料规模小、数据稀疏
iii. 技术方法和研究现状
A. 事件识别和抽取
a. 基于模式匹配的方法
a.1. 基于人工标注语料的方法
a.2. 弱监督的方法
b. 基于机器学习的方法
b.1. 基于特征的方法
b.1.1. 句子级信息
b.1.2. 篇章级信息
b.2. 基于结构预测的方法
b.3. 基于神经网络的方法
b.4. 弱监督的方法
c. 中文事件抽取
c.1. 公开评测
c.2. 领域扩展
c.3. 跨语料迁移
B. 事件检测和跟踪
a. 相似度聚类法
a.1. 定义相似度度量
a.2. 进行聚类或分类
a.3. TDT中用向量空间模型(VSM)
a.4. 平均聚类(GAC)和单一通过法(SPA)主题
a.5. 利用衰减函数和时间窗口对事件聚类进行约束
b. 基于概率统计
b.1. 对新闻等规范类文档
b.2. 对不规范文档
C. 事件知识库构建
a. 基于句子级的事件抽取
b. 基于文档及的事件发现
iv. 技术展望与发展趋势
A. 事件识别和抽取的发展趋势
a. 分步抽取到联合抽取
b. 局部信息到全局信息
c. 人工标注到半自动生成语料
B. 事件检测和追踪的发展趋势
a. 非参数化
b. 多流交互
2. 知识图谱查询及推理计算
I. 知识存储和查询
目前多以三元RDF形式存储并以SPARQL查询
i. 任务定义、目标和研究意义
以图的方式展示实体、实体属性、实体间关系,在语义网中基于RDF(资源描述框架)来让计算机理解其之间的语义关联关系
ii. 研究内容和关键科学问题
A. 如何有效存储和查询大规模RDF数据集
a. DBpedia
b. YAGO
c. Freebase
iii. 技术方法和研究现状
A. 基于关系数据模型的RDF数据存储和查询
a. 简单三列表
b. 水平存储
c. 属性表
d. 垂直划分策略
e. 全索引策略
B. 基于图模型的RDF数据存储和查询
a. gStore
b. dipLODocus[RDF]
c. TurboHOM++
iv. 技术展望与发展趋势
A. 基于已有云平台得分布式RDF数据查询处理方法
a. Hadoop
b. Trinity.RDF
c. Sempala
B. 基于数据划分的分布式RDF数据查询处理方法
a. METIS
C. 联邦型分布式RDF数据查询处理方法
a. DARQ
b. SPLENDID
c. FedX
II. 知识推理
从给定的知识图谱推导出新的实体与实体间的关系
i. 任务定义、目标和研究意义
A. 知识图谱的不完备性
B. 知识图谱中存在错误的关系
ii. 研究内容和关键科学问题
A. 知识图谱的表示
如何对模式知识图谱进行数值表示是一个难点
B. 基于符号的并行知识推理
a. 单机环境下的多核、多处理器技术
b. 多机环境下基于网络通信的分布式技术
C. 实体关系学习方法
a. 基于表示学习的方法
b. 基于图特征的方法
D. 模式归纳方法
a. 基于归纳逻辑编程进行模式归纳的研究
b. 基于关联规则挖掘进行模式归纳的研究
c. 基于机器学习进行模式归纳的研究
iii. 技术方法和研究现状
A. 知识图谱的表示
A.1. KL-ONE和CLASSIC
A.2. FaCT
B. 基于符号的并行知识推理
a. 基于多核、多处理器技术的大规模推理
a.1. RDFS
a.2. OWLEL
b. 基于分布式技术的大规模推理
b.1. Peer-To-Peer
b.2. MapReduce
b.3. WebPIE
C. 实体关系学习法
a. 基于表示学习的方法
a.1. TransE
a.2. RESCAL
b. 基于图特征的方法
b.1. FOIL算法
b.2. AMIE算法
D. 模式归纳方法
a. 基于 ILP 的模式归纳方法
b. 基于关联规则挖掘的模式归纳方法
c. 基于机器学习的模式归纳方法
iv. 技术展望与发展趋势
A. 基于符号推理的发展趋势
a. 时空知识图谱如何进行表示
b. 事件图谱如何进行表
c. RDFox
c.1. 更复杂本体的推
c.2. 查询重写
c.3. 本体或者规则的管理
B. 基于统计推理的发展趋势
a. 基于表示学习的推理方法的推理精
b. 利用深度神经网络架构建模
3. 知识图谱应用
I. 通用知识和领域知识图谱
面向通用领域的结构化的百科知识库与面对某一特定领域的行业知识库
i. 任务定义、目标和研究意义
A. 通用知识图谱
B. 领域知识图谱
ii. 研究内容和关键科学问题
A. 领域知识图谱生命周期
a. 知识建模
b. 知识获取
c. 知识融合
d. 知识存储
e. 知识计算
f. 知识应用
iii. 技术方法和研究现状
A. 知识图谱构建方法研究
a. 自底向上的构建方法
b. 自顶向下的构建方法
b.1. D2R工具
b.2. 包装器
b.3. 借助信息抽取
B. 知识图谱研究现状
iv. 技术展望与发展趋势
A. 逐步扩充对于时序知识、空间知识、事件知识等的表示
B. 文本抽取中融入深度学习思想
C. 知 识图谱辅助多媒体数据处理
II. 语义集成
将不同知识图谱融合为一个统一、一致、简洁的形式并为彼此交互提供语义操作性
i. 任务定义、目标和研究意义
将不同知识图谱融合为一个统一、一致、简洁的形式,为使用不同知识图 谱的应用程序间的交互建立互操作性
A. 本体匹配
B. 实例匹配
C. 知识融合
ii. 研究内容和关键科学问题
A. 语义集成的常见流程
a. 语义集成的输入
b. 预处理
c. 匹配
d. 知识融合
e. 语义集成的输出
iii. 技术方法和研究现状
A. 本体匹配
a. 多本体全体匹配
b. 跨语言本体匹配
B. 实例匹配
a. 基于人机协作的实例匹配
b. 基于表示学习的实例匹配题
c. 基于强化学习的实例匹配
C. 知识融合
D. 语义集成评测
iv. 技术展望与发展趋势
A. 表示学习
B. 人机写作
C. 语义集成的评测数据集
a. 人造数据集
b. 真实世界中的数据集
通用的大规模评测数据集
III. 语义搜索
基于实体和关系的检索
i. 任务定义、目标和研究意义
ii. 研究内容和关键科学问题
iii. 技术方法和研究现状
主要方法:图理论、匹配算法、描述逻辑和模糊逻辑
A. 主流语义网搜索引擎
a. Swoogle
a.1. Swoogle
a.2. Congnition
a.3. Hakia
a.4. Factbites
a.5. DeepDyve
a.6. Kngine
b. TUCUXI
B. 技术要点及研究现状
a. 引入推理和关联关系的语义搜索
a.1. Triple
a.2. HOWLIR
a.3. Swangler
b. 语义搜索中的查询扩展
c. 语义搜索中的索引构建
iv. 技术展望与发展趋势
A. 语义搜索概念模型
B. 语义搜索本体知识库的构建、维护和进化
C. 语义搜索的推理机制
D. 语义搜索的结果排序
E. 语义搜索的原型系统实现
IV. 基于知识的问答
返回给用户自然语言形式的答案
i. 任务定义、目标和研究意义
A. 涉及关键技术
a. 词法分析
b. 句法分析
c. 语义分析
d. 信息检索
e. 逻辑推理
f. 语言生成
B. 现有研究趋向
开放域、面向大规模、多源异构知识库问答系统构建
ii. 研究内容和关键科学问题
A. 问句语义解析
B. 大规模知识推理
C. 异构知识关联
iii. 技术方法和研究现状
A. 基于语义解析的知识库问答方法
a. 语义解析方法
a.1. 组合范畴语法
a.2. 依存组合语法
b. 困难及解决方法
b.1. 面对训练数据标注困难
半监督学习、外部资源、弱监督学习、同义对应
b.2. 面对歧义更加严重
联合模型、图搜索
b.3. 面对多源异构 知识库
子问题划分、整数线性规划
B. 基于检索排序的知识库问答方法
C. 技术现状
iv. 技术展望与发展趋势
A. 面向复杂问句的深度学习知识库问答方法
如何利用深度学习的方法解决复杂问题
B. 分布式表示与符号表示相结合的知识库问答
如何将深度学习与传统语义方法进行深度融合
C. 面向问答的深度推理
如果利用深度学习大规模、可学习的特点,在深度神经网络框架下, 融入传统的逻辑推理规则,构建精准的大规模知识推理引擎
D. 对话中的自然语言形式回复
如何与知识库相结合,将知识库问答的答案加 入自然语言回复中
应用