导图社区 第四章 数据的概括性度量
这是一篇关于第四章 数据的概括性度量的思维导图,包括:集中趋势、离散程度、偏态与峰度的度量。
这是一篇关于统计学 第七章 参数估计的思维导图
这是一篇关于第六章 统计量及其抽样分布_backup_26233a的思维导图
统计学 第五章 概率与概率分布,包括随机事件及其概率、事件的概率、离散型随机变量的概率分布、连续型随机变量的概率分布。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
第四章 数据的概括性度量
集中趋势
1)分类数据
众数:M0,出现次数最多的变量值,在数据量大时有用,也可用于数值/顺序数据 特点:不受极端值影响;具有明显集中趋势点;不具有唯一性
2)顺序数据
中位数:Me,也可用于数值型数据,位置为(n+1)/2 特点:不受极端值影响;具有唯一性;偏斜程度大
四分位数:下四分位数(25%,QL=(n+1)/4);上四分位数(75%,Qu=3(n+1)/4)
3)数值型数据
简单平均数:适用于未分组数据 特点:受极端值影响,具有唯一性,对称分布
加权平均数:适用于分组数据,Mi为组中值,fi为频数
几何平均数:平均比率,平均增长率
4)众数、中位数、平均值的比较
对称分布:Mo=Me=X拔(X拔指的是X的均值)
左偏(高峰在右侧,长尾在左侧):Mo>Me>X拔
右偏(高峰在左侧,长尾在右侧):Mo<Me<X拔
离散程度
各变量偏离中心值的程度
1)分类数据:异众比率,即非众数组频数占总频数的比例, fm为众数组频数,比率越高,众数代表性越低,离散程度越大
2)顺序数据:四分位差,Qd=Qu-QL(上-下); 四分位差越小,离散程度越低,不受极端值影响
极差:R=极大值-极小值,受极端值影响
平均差(平均绝对离差)
未分组:
分组:(Mi为组中值)
样本方差
分组:
标准差
相对位置的度量
标准分数(Z分数):标准化后均值为0,标准差为1;
经验法则:前提是要对称分布 约有68%的数据在±1个标准差的范围之内 约有95%的数据在±2个标准差的范围之内 约有99%的数据在±3个标准差的范围之内
切比雪夫不等式:若不对称分布 至少有75%的数据在±1个标准差范围之内 至少有89%的数据在±2个标准差范围之内 至少有94%的数据在±3个标准差范围之内
4)相对离散程度:离散系数(变异系数),比较不同样本数据的离散程度,越小越稳定
偏态与峰度的度量
1)偏态(偏斜程度)
特点:>0右偏,<0左偏;>1/<-1高度偏态分布;0.5-1/(-1)-(-0.5)中度偏态分布
2)峰态(扁平程度)
特点:>0尖峰,<0扁平