导图社区 数据分析入门
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。如何入门数据分析,要做到这几点!
社区模板帮助中心,点此进入>>
数据分析入门
技术
EXCEL
SQL
power BI
数据分析方法
描述统计
制表和分类 图形 计算概括性数据来描述数据的集中趋势,离散趋势,离散趋势,偏度,峰度
假设检验
参数检验
U验 使用条件:当样本含量n较大时,样本值符合正态分布
T检验 使用条件:当样本含量n较小时,样本值符合正态分布
非参数检验
针对总体分布情况做的假设,
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。
信度分析
检査测量的可信度,例如调查问卷的真实性。
列联表分析
用于分析离散变量或定型变量之间是否存在相关
相关分析
研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。
方差分析
使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。
回归分析
一元线性回归分析、多元线性回归分析、Logistic回归分析以及其他回归方法:非线性回归、有序回归、加权回归等
聚类分析
样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量。
判别分析
根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体
主成分分析
将彼此相关的一组指标转化为彼此独立的一组新的指标变量,并用其中较少的几个新指标变量就能综合反应原多个指标变量中所包含的主要信息 。
因子分析
一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法
ROC分析
R0C曲线是根据一系列不同的二分类方式(分界值或决定阈).以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线
其他分析方法
时间序列分析
生存分析
对应分析
决策树分析
神经网络
行业知识
搜索
总结
思考