导图社区 商务分析重点考点
商务分析重点考点,广州大学期末考试重点整理笔记
毛概二轮复习 考前一天的复习,都是精华重点
市场营销学第10-14章思维导图,对全书的一个考前重点内容梳理
对市场营销学一书重点章节的梳理思维导图
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
商务分析考点
第一章商务分析概论
3个类型
描述型分析
描述以前发生了什么(报表平均数中位数方差)
预测性分析
预测未来会发生什么(时间序列分析、概率)
规范性分析
描述将产生最佳结果的最佳方法(最优解)
3个视角
业务
决策与执行视角
分析
技术视角
IT
工具和系统的视角
分析的发展历程
演化过程
第三章商业问题的分析和建模
商业数据分析基本步骤
需求定义
数据采集与评估
建立模型
模型评估
知识表达
回归分析的数据建模步骤
识别和选择重要的预测因素
选择适当的回归模型
模型的评估
第四章商业信息的采集
第五章商业信息的管理
数据库与数据仓库的区别(5个点)
数据仓库设计的主要步骤(大题)
总体分析设计
概念模型设计
逻辑模型设计
物理模型设计
数据仓库的生成
数据字典和元数据
第二章流程、方法和工具
流程与步骤
业务需求
商业目标
实行方式
需求范围
利害关系人
关键特性
锁定使用者
使用者的利益
安全性问题
确定目标的优先级
商业信息的收集(渠道)
内部信息
人际关系网(第三方)信息
文献信息
网络信息
数据挖掘与预处理
数据挖掘的方式
分类
聚类
关联
序列分析
回归分析
其他技术
数据变换
什么是数据变换?
将数据转换或归并成一个合适数据挖掘的描述形式
简答题(数据变换的五个步骤)
平滑处理
合计处理
数据泛化处理
规格化
子主题
属性构造
主要方法
分析方法
时间序列分析
描述型时间序列分析
统计型时间序列分析
挖掘方法
决策树
关联规则
第八章商业中的非结构化信息分析
简答题一:文本挖掘的一般过程(5个步骤)
文本预处理
特征抽取和特征集缩减
模式发现
模式质量评价
结果可视化
简答题二:社会网络分析基本原里(6个点)
关系纽带经常是不对称地相互作用着的,在内容和强度上都有所不同
关系纽带间接或直接地把网络成员连接在一起,故必须在更大的网络结构背景中对其加以分析
社会纽带结构产生了非随机的网络,因而形成了网络群、网络界限和交叉关联
交叉关联把网络群以及个体联系在一起
不对称的纽带和复杂网络使稀缺资源的分配更加不平等
网络产生了以获取稀缺资源为目的的合作和竞争行为
第七章商业数据挖掘方法
数据挖掘
种类
监督学习(分类学习)
无监督学习(聚类分析)
关联规则挖掘
预测
时空挖掘
偏差分析
跨行业数据挖掘过程标准(选择题)
业务理解
数据理解
数据准备
建模
评估
部署
节点(选择题)注意没有外部节点!!!
父节点
内部节点
叶节点
分类决策树
回归决策树
应用
分类预测
定性的分类预测称为分类,用来确定类别属性
定量的分类预测称为预测,用来预测具体的数值
决策树2大核心问题
生长
剪枝
(剪枝方法)
预剪枝
后剪枝
常用算法
分类算法(选择题)
NBC算法 LR算法 SVM算法 ID3算法 C4.5 算法 C5.0算法 KNN 算法 ANN 算法
最小指标Gini指标方法
CART
SLIQ
SPRINT算法
元数据
计算大题
ID3算法
算目标属性的信息量info
算参考属性的信息来info
每个参考属性的信息熵(加权)E
信息增益Gain
排序Gain
Apriori算法
概念
项集:项的集合
K项集:包含K个项的项集
事物:是项的集合
支持度:P(A∪B)
置信度:P(BlA)
频繁项集
一个频繁项目集的子集也必定是频繁项目集。一个非频繁项目集的任一子集必定也是非频繁项目集
聚类分析
聚类与分类的区别
聚类是一种无指导学习(无监督学习),即从样本的特征向量出发,通过某种算法将特征相似的样本聚集在一起,从而达到区分具有不同特征的样本的目的。
分类是一种有指导学习(有监督学习),它具有先验知识(分类属性值,即分类标记),而无监督聚类学习并不具有这种先验知识。
聚类算法(选择题)
划分聚类算法
K-means,K-medoids及扩展算法
CLaks,CLARANS
层次聚类算法
CURE算法,ROCK算法
BIRCH算法
基于密度的聚类算法
DBSCAN算法
GDBSCAN,DBCLASD算法
OPTICS算法
FOC算法
基于网格的聚类算法
理解业务问题的基础上,利用IT技术进行数据的处理和呈现,应用各种分析模型进行数据分析和挖掘,描述业务现状,预测业务未来,提出业务解决方法
粒度
数据粒度是指数据仓库的数据中保存数据的细化程度或综合程度的级别
细化程度越高,粒度级别就越小(判断题)
K-means不会丢弃被它使用的对象!
第六章商业数据分析方法
一元
多元
Logistic回归
主要用途(4个详细点,6分大题)
系统描述
根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述
系统分析
当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理。
预测未来
一般用ARMA模型拟合时间序列,预测该时间序列未来值。
决策和控制
根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制
交叉影响分析
实施步骤(5个点,简答题6分)
确定目标事件中相互存在重要影响关系的各事件及其相互之间的影响关系
评定各事件的初始概率Pj
评定各事件的相互影响概率Pij
通过随机取样的方式进行试验
将过程概率Pj'全部恢复为初始概率Pj,进行下一次试验。通过多次反复试验,得到Pj*,用Pj*代替Pj