导图社区 数据挖掘原理与算法(第三版)第一章 绪论
这是一篇关于数据挖掘原理与算法(第三版)第一章绪论的思维导图,主要包括:1.1数据挖掘的产生与发展;1.2数据挖掘研究的发展趋势;1.3数据挖掘概念;1.4数据挖掘技术的分类问题;1.5数据挖掘常用的知识表示模式与方法;1.6不同数据存储形式下的数据挖掘问题;1.7粗糙集方法及其在数据挖掘中的应用;1.8数据挖掘的应用分析;1.9本章小结和文献注释。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
第一章 绪论
1.1数据挖掘的产生与发展
1.1.1数据挖掘技术的商业需求分析
1.数据挖掘引起专家学者和商业厂家需求的主要原因:大型数据系统的广泛使用和把数据转换成有用知识的迫切需求。
2.数据挖掘技术随着时代发展的变革。
3.可以将数据、信息、知识看成广义数据表现的不同形式。
1.1.2数据挖掘产生的技术背景
1.技术基础:计算机及其相关技术的发展。
2.数据挖掘产生的技术背景:数据库、数据仓库和Internet等信息技术的发展、计算机性能的提升和先进的体系结构的发展、统计学和人工智能等方法在数据分析中的研究和应用。
1.1.3大数据时代的数据挖掘技术需求分析
1.大数据研究的发展可以粗略划分成三个阶段:2000年及以前,称为“大数据概念的萌芽阶段”、2001-2010年,称为“大数据概念探索阶段”、2011年及以后,大数据概念进一步深化,已经成为学术研究的焦点,成为许多应用支撑的概念。
2.目前的大数据概念的四个视角:数据论、方法论、环境论、属性论。
以属性论为基础,说明数据挖掘技术是大数据分析的核心,需要加强的新的挑战性技术方法有:大容量的数据分析需要数据挖掘技术来支撑、高速聚集的大数据为数据挖掘提出新的挑战性课题、类型多样的大数据需要数据挖掘的相关研究分支的发展来支撑、价值巨大的大数据正是数据挖掘技术的研究目标。
1.2数据挖掘研究的发展趋势
数据挖掘需要重点开展工作的几大方面:数据挖掘技术与特定商业逻辑的平滑集成问题、数据挖掘技术与特定数据存储类型的适用问题、大型数据的选择与规格化问题、数据挖掘系统的构架与交互式挖掘技术、数据挖掘语言与系统的可视化问题、数据挖掘理论与算法研究。
1.3数据挖掘概念
1.3.1从商业角度看数据挖掘技术
数据挖掘从本质上说是一种新的商业信息处理技术
1.3.2数据挖掘的技术含义
1.数据库中的“知识发现”(KDD)
2.数据挖掘与知识发现(DMKD)
3.数据挖掘技术的含义:KDD 看成数据挖掘的一个特例、数据挖掘是KDD过程的一个步骤、KDD与Data Mining含义相同。
1.1.3数据挖掘研究的理论基础
一些重要的理论框架:模式发现框架、规则发现框架、基于概率和统计理论、微观经济学观点、基于数据压缩理论、基于归纳数据库理论、可视化数据挖掘。
1.4数据挖掘技术的分类问题
根据挖掘任务分类
根据挖掘对象分类
根据挖掘方法分类
根据数据挖掘所能发现的知识分类
1.5数据挖掘常用的知识表示模式与方法
1.5.1广义知识挖掘
1.定义:广义知识挖掘是指描述类别特征的概括性知识。
2.概念描述方法:本质上是对某些对象的内涵特征进行概括。概念描述分为特征性描述和区别性描述。
3.多维数据分析可以看作是一种广义知识挖掘的有效方法。
4.多层次概念描述问题(目前使用较多的概念分层方法):集合分组分层、基于规则分层、操作导出分层、模式分层。
1.5.2关联知识挖掘
1.定义:关联知识反映一个事件和其他事件之间的依赖或关联。
2.目的:找出数据库中的隐藏信息。
3.类型:简单关联、时序关联、因果关联、数量关联。
4.广义上讲,关联分析是数据挖掘的本质。
5.关联规则挖掘是关联知识发现的最常用方法。
1.5.3类知识挖掘
1.定义:类知识刻画了一类事物,这类事物具有某种意义上的共同特征,并明显和不同类事物相区别。
2.挖掘类知识的两个基本方法
分类:决策树、贝叶斯分类、神经网络、遗传算法与进化理论、类比学习、其他。
基于层次的聚类方法聚类:基于划分的聚类方法、基于密度的聚类方法、基于网格的聚类方法、基于模型的聚类方法。
1.5.4预测型知识挖掘
定义:预测型知识挖掘是指由历史和当前数据产生的并能推测未来数据趋势的知识。
模式:趋势预测模式、周期分析模式、序列模式、神经网络。
1.5.5特异型知识挖掘
可以通过以下问题帮助了解特异型知识挖掘的任务和方法:孤立点分析、序列异常分析、特异规则发现。
1.6不同数据存储形式下的数据挖掘问题
1.6.1事务数据库中的数据挖掘:一个事务数据库是对事务数据的收集。
1.6.2关系型数据库中的数据挖掘
目前研究的一些问题:多维知识挖掘问题、多表挖掘和数量挖掘问题、多层知识挖掘问题、知识评价问题、约束数据挖掘问题。
1.6.3数据仓库中的数据挖掘:0LAM、OLAP.
1.6.4在关系模型基础上发展十五新型数据库中的数据挖掘
1.6.5面向应用的新型数据源中的数据挖掘
数据挖掘的数据类型:结构型数据挖掘、非结构型数据挖掘、半结构型数据挖掘。
Wed挖掘必须面对的一些关键问题:异构数据源环境、半结构化的数据结构、动态变化的语言环境。
Wed挖掘的研究的三种流派:Wed结构挖掘、Wed使用挖掘、Wed内容挖掘。
1.6.6Web数据源中的数据挖掘
1.7粗糙集方法及其在数据挖掘中的应用
1.7.1粗糙集的一些重要概念
粗糙集理论是一种研究不精确、不确定性知识的教学工具。粗糙集把客观世界抽象为一个信息系统。
约简:极小属性集。
1.7.2粗糙集应用举例
1.7.3粗糙集方法在KDD中的应用范围:规则学习和决策表推导、知识简约、属性相关分析、进行数据预处理。
1.8数据挖掘的应用分析
1.8.1数据挖掘与CRM:数据挖掘能帮助企业确定客户特点,使企业能够为客户提供有针对性的服务。
1.8.2数据挖掘与社会网络:许多例子说明二者的融合发展趋势。
1.8.3数据挖掘应用的成功案例分析
数据挖掘在体育竞技中的应用
数据挖掘应用到商业银行中:金融投资、欺诈甄别。
数据挖掘应用到电信中
数据挖掘应用到科学探索中
数据挖掘在信息安全中的应用
1.9本章小结和文献注释