导图社区 统计学第四章数据的概括性度量
统计学第四章数据的概括性度量期末考试,集中趋势的度量:分类数据:众数Mo、顺序数据:中位数和分位数、数值型数据:平均数。
跨国公司内部贸易,跨国公司的转移定价策略:转移定价通常做法:调整子公司半成品或零部件的进出口价格、调整向子公司出售机器设备的价格和折旧期限。
计量经济学 第5章自相关性知识总结,包括自相关性定义产生的原因、自相关性的后果、自相关性的检验、自相关性的解决方法等。
计量经济学 第6章 多重共线性知识总结,包括多重共线性及其产生原因、多重共线性造成的影响、多重共线性的检验、多重共线性的解决方法等。
社区模板帮助中心,点此进入>>
英语词性
法理
刑法总则
【华政插班生】文学常识-先秦
【华政插班生】文学常识-秦汉
文学常识:魏晋南北朝
【华政插班生】文学常识-隋唐五代
民法分论
日语高考動詞の活用
第14章DNA的生物合成读书笔记
数据的概括性度量
集中趋势的度量
分类数据:众数Mo
也可适用于顺序数据、数值型数据
顺序数据:中位数和分位数
也适用数值型数据,不适用于分类数据
中位数Me位置=
四分位数
下四分位数QL位置=
上四分位数Qu位置=
数值型数据:平均数
简单平均数(未经分组)
样本加权平均数(根据分组数据算)
几何平均数:n个变量值乘积的n此方根
当变量值为比率形式,如平均增长率
众数,中位数、平均数比较
关系
对称分布
左偏分布
右偏分布
应用场合
众数:一组数据分布的峰值,不受极端值影响
缺点:【不唯一性,1个/2个/】【数据少,不宜众】
中位数:一组数据中间位置的代表值,不受极端值影响
适用一组数据的偏斜程度大时
平均数:易受极端值影响,对于偏态数据代表性差
离散程度的度量
分类数据:异众比率Vr
非众数组的频数占总频数的比例
异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差
顺序数据:四分位差(内距/四分间距)
反映中间50%数据的离散程度
上四分位数-下四分位数
数值越小,中间数据越集中;越大,越分散
不受极值影响
也可用于数值型数据;不适合分类数据
数值型数据:方差、标准差
极差(全距)
易受极端值影响
不能反映中间数据的分散情况,因而不能准确描述出数据的分散程度
平均差(平均绝对离差)
各变量值与其平均数离差绝对值的平均数
未分组
分组
以平均数为中心,反映每个数据与平均数的差异程度
全面反映一组数据的离散状况
平均差越大,数据离散程度越大
方差
各变量值与其平均数离差平方的平均数
标准差
相对位置的度量
标准分数(统计标准化公式)
不同量纲的变量进行处理
e.g.
若某个已知的标准分数为-1.5,则该数值低于平均数1.5倍的标准差。
经验法则
数据为对称分布
约68%的数据在平均数±1个标准差的范围之内
约95%的数据在平均数±2个标准差的范围之内
约99%的数据在平均数±3个标准差的范围之内
切比雪夫不等式
数据不为对称分布
至少有75%的数据在平均数±2个标准差的范围之内
至少有89%的数据在平均数±3个标准差的范围之内
至少有94%的数据在平均数±4个标准差的范围之内
相对离散程度:离散系数(变异系数)
主要用于比较不同样本数据的离散程度
平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的
可消除变量值水平高低和计量单位不同对离散程度测度值的影响
一组数据的标准差与其相应平均数之比
离散系数越大,数据离散程度越大
偏态与峰态的度量
偏态系数(SK)
对数据分布对称的测度——偏态系数=0;越接近0,偏斜程度越低
偏态系数>1或<-1,——高度偏态分布
偏态系数0.5~1或-1~-0.5之间——中等偏态分布
SK正,正偏/右偏
SK负,负偏/左偏
峰态系数(K)
对数据分布平峰或尖峰程度的测度
数据服从正态分布——K=0
K>0,尖峰,数据分布更集中
K<0,扁平分布,数据分布越分散
集中趋势:指一组数据向某一中心值靠拢的程度,它反映了一组中心点的位置所在。