导图社区 知识图谱是什么
理解知识图谱是什么以及应用
社区模板帮助中心,点此进入>>
知识图谱
知识图谱技术综述
产品经理知识图谱
知识图谱融合
第十三章知识图谱
知识图谱概念
IA03
知识图谱构建技术综述
知识表示与知识图谱
参考资料:http://www.woshipm.com/it/2627356.html
2、知识图谱构建的关键技术
知识抽取:把数据从不同的数据源中抽取出来,然后按一定的规则加入到知识图谱中
数据源:分结构化和非结构化
非结构化数据需要使用自然语言处理技术:实体命名识别、关系抽取、实体统一、指代消解等
2.1实体命名识别
根据提供的文本进行实体识别,并给每个实体进行分类或打标签,例如:1984年12月30日”记为“时间”类型;“克利夫兰骑士”和“迈阿密热火”记为“球队”类型。
2.2关系抽取
把实体之间的关系抽取出来的一项技术,其中主要是根据文本中的一些关键词,如“出生”、“在”、“转会”等,例如可以判断詹姆斯与地点俄亥俄州(出生地)、与迈阿密热火(所属球队)等实体之间的关系。
2.3实体统一
同一个实体会有不同的写法,比如说“LBJ”就是詹姆斯的缩写,因此“勒布朗詹姆斯”和“LBJ”指的就是同一个实体
2.4指代消解
指代消解要做的事情就是,找出这些代词(他、她、它、你、该建筑等),都指的是哪个实体。
3、知识图谱的存储
3.1基于RDF的存储
特点1:三元组的方式来存储数据而且不包含属性信息。
特点2:标准的推理引擎
特点3:W3C标准
特点4:易于发布和共享数据
特点5:多数为学术界场景
3.2基于图数据的存储
特点1:高效的图查询和搜索上(图的遍历效率高)
特点2:一般以属性图为基本的表示形式,所以实体和关系可以包含属性。
特点3:事物管理
特点4:基本为工业界场景
特点5:没有标准的推荐引擎
4、知识图谱在金融的应用
4.1反欺诈
需要以人为核心,展开一系列的数据构建,例如:用户的基本信息、借款记录、工作信息、消费记录、行为记录、网站浏览记录等整合到知识图谱中,通过不同维护数据权重整体进行预测和评分,判断用户欺诈的概率?
4.2不一致性验证
不同的二个借款人,填写了同一电话号码,有可疑
借款人和二个人都是母子关联,按推理这二人是兄弟关系,但图谱现实是朋友关系,有异常
4.3客户失联管理
在失联的情况下,知识图谱可以挖掘更多失联人的联系人,从而提高催收效率。
4.4知识推理
就是机器模仿人的一种重要的能力,可以从已有的知识中发现一些隐藏的知识。当然这样的能力离不开深度学习
例如:小明在苏宁上班,小刚也在腾讯上班,可以推理出,小明和小刚是同事关系。
例如:小刚是大刚的儿子,大刚是老刚的儿子,可以推理出,小刚是老刚的孙子,可以更加完善知识图谱。
1、什么是知识图谱
定义:一种基于图的数据结构,由节点(point)和边(Edge)组成,每个节点表示一个“实体”,每条边为实体与实体之间的“关系”,知识图谱本质上是语义网络。
实体:现实世界中的事物,比如商品、人物、动物、地名、公司、电话等;
关系:表达不同实体之间的某种联系
例如:在百度搜索中搜索“周杰伦的老婆”的时候,搜索结果不是周杰伦,而是直接返回了昆凌的信息卡片”;因为底层知识图谱已经有了周杰伦和昆凌是夫妻关系,说明了知识图谱有理解用户意图的能力。