导图社区 计算机-数据挖掘课程
这是一篇关于数据挖掘课程的思维导图,包含基础分类方法、高级分类方法、基础聚类方法等。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
数据挖掘
分类
基础分类方法
决策树
类型
ID3:基于信息增益
C4.5:基于信息增益率
CART:基于基尼指数
常见算法
Rainforest
基于AVC-list来建树
BOAT
有放回的重抽样
朴素贝叶斯
前提:各个属性之间相互独立
基于规则的分类
IF-THEN规则
提取规则
从决策树中直接提取
在样本中提取:顺序覆盖法
模型评估与选择
评估
混淆矩阵
准确率,错误率,灵敏度,特异性,精度,召回率,F度量
Holdout保持方法,交叉证实,Bootstrap
选择
假设检验
ROC曲线
提高分类准确率
Bagging
Boosting
随机森林
高级分类方法
贝叶斯信念网络
有向无环图+条件概率表
人工神经网络
后向传播算法
支持向量机SVM
线性SVM
非线性SVM
基于频繁模式的分类
懒惰学习:KNN,CBR(案例推理)
其他方法
遗传算法 CA
半监督学习方法
自我训练+协同训练
迁移学习
聚类
基础聚类方法
划分方法
k-均值
k-中心
PAM
对PAM的改进
CLARA,CLARANS
层次方法
凝聚
BIRHC(增量聚类)
Chameleon (动态模型)
分裂
基于密度的聚类
DBSCAN
聚类的评估方法
估计聚类趋势
霍普金斯统计量
确定聚类簇个数
经验方法
肘方法(ELBOW METHOD)
m倍交叉证实
测定聚类质量
外在方法
BCubed
内在方法
轮廓系数
高级聚类方法