导图社区 第四章统计数据分布特征的描述
一、众数 二、中位数 三、四分位数 四、均值 五、几何均值 六、切尾均值 七、众数、中位数和均值的比较第4章数据分布特征的描述 众数第4章数据分布特征的描述 众数 (mode) 1. 一组数据中出现次数最多的变量值 2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据和数值型数据 6. 众数计算公式见书页。
这是一个关于第一章总论的思维导图,主要内容有什么是统计、什么是统计学、统计学的基本概念。
第一节总量描述与相对比较 第二节 集中趋势的描述 第三节 离散程度的描述 第四节 偏态与峰度的描述 第五节 SPSS描述统计分析 当人们对某个现象的发生感到兴趣...
社区模板帮助中心,点此进入>>
马克思主义原理
考研数学重点考点知识总结归纳!
数据结构
法理学读书笔记
思维导图带你认识马克思主义原理
建筑光学基本知识
考研英语一写作
教育学考研:教育学原理第八章教学内容整理
考研三步翻译技巧
东方文明古国的教育
第四章 统计数据分布特征的描述
分布集中趋势的测度 (测度集中趋势就是寻找数据一般水平的代表值或中心值)
平均指标 (平均数)
位置平均数 (先将总体各单位的变量值按一定顺序排列, 然后取某一位置的变量值来反映总体各单位的一般水平)
众数M0
适用范围
品质标志
定类数据集中趋势
定序数据集中趋势
数量标志
定比数据集中趋势
计算方法
组距式数列
方法一 M0=众数所在组下限+(众数所在组次数与其下限的邻组次数之差/(众数所在组次数与其下限的邻组次数之差+众数所在组次数与其上限的邻组次数之差)×众数所在组的组距
方法二 M0=众数所在组上限-(众数所在组次数与其上限的邻组次数之差/(众数所在组次数与其下限的邻组次数之差+众数所在组次数与其上限的邻组次数之差)×众数所在组的组距
特点
不受极值影响,具有代表性
分布数列均匀分布,无众数
众数组相邻的上一组多,众数组相邻的下一组少,众数在众数组内偏向该组上限
缺乏敏感性
中位数Me
概念
在一个等差数列或一个正态分布数列中,中位数就等于算术平均数
中位数不受极端变量值的影响
计算
未分组
分组
方法一 Me=中位数所在组下限+(总次数/2-中位数所在组以下的累计次数)/中位数所在组的次数×中位数所在组的组距
方法一 Me=中位数所在组上限+(总次数/2-中位数所在组以上的累计次数)/中位数所在组的次数×中位数所在组的组距
有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会收到影响
中位数缺乏敏感性
四分位数
数值平均数 (从总体各单位变量值中抽象出具有一般水平的量)
算术平均数 (均值)
公式:总体标志总量(变量值总量)/总体单位总量(变量值个数)
分类
简单算术平均数
加权算术平均数
公式:每一组组中值与其所在组的频数之积相加
如果计算相对数的平均数,将分子视为总体标志总量,分母视为总体单位总量
算术平均数的权数
权数问题是计算平均数的核心问题
客观权数
客观权数是指被平均的变量存在客观联系的指标
两个方面考虑
次数分布数列
次数,频数
根据事物的内在属性确定权数
主观权数
根据人们的经验设定权数
作用小赋小权数,作用大赋大权数
算术平均数的性质
利用算术平均数作为代表值,可以使误差相互抵消,反映出事物必然性的数量特征
性质
各变量值与其算术平均数的离差之和等于0—每一个(变量-平均值)×频数相加=0
各变量值与其算术平均数的离差平方和最小
算术平均数的特点和应用
受极值影响大
极大—算术平均数偏大
极小—算数平均值偏小
不能正确反映总体的一般水平
不能准确测定总体集中趋势
应用
剔除极值
切尾平均数
调和平均数 (角标为H)
概念:是根据标志的倒数计算的,它是标志值倒数的算术平均数的倒数,也称为倒数平均数
简单调和平均数
加权调和平均数
比简单调和平均数多×一个频数
注意
当数据出现0时不宜计算调和平均数
易受极端值影响,受极小值的影响比受极大值的影响更大
只要有一个变量值为零,就不能计算调和平均数
当组距数列有开口组时,调和平均数的代表性就很不可靠
调和平均数应用的范围较小
几何平均数 (角标为G)
概念:它是对以连续比率变化或以几何级数变化的变量的平均数 它是M个变量值乘积的M次方根
分类
简单几何平均数
直接将n项变量连乘,然后对连乘积开n次方根所得的平均数
加权几何平均数
将n项变量的各项变量的各项频数次方的连乘,然后对连乘积开全部频数和次方根所得的平均数
几何平均数受极端值的影响较算术平均数小
如果变量值有负值,计算出的几何平均数就会成为负数或虚数
仅适用于具有等比或近似等比关系的数据
几何平均数的对数是各变量值对数的算术平均数
几种集中趋势测度值的比较
算术平均数,众数和中位数三者的关系
当总体分布呈对称状态时,三者合而为一
算术平均数=M0=Me
当总体分布呈右偏(上偏)时,众数最小,算术平均数最大
M0<Me<算术平均数
当总体分布呈左偏(下偏)时,算术平均数最小,众数等于中位数
算术平均数<M0=Me
中位数与算术平均数的距离是众数与算术平均数的距离的三分之一
众数-算术平均数的绝对值=三倍(中位数-算术平均数)的绝对值
|算术平均数-M0|=3×|算术平均数-Me|
算术平均数,几何平均值和调和平均数三者的关系
H≤G≤算术平均数
只有当所有变量值都相等时它们才相等
适用于静态的总量指标,相对指标,平均指标
算术平均数
调和平均数
适用于计算时间上相互衔接的比率或速度的平均数
几何平均数
分布离散程度的测度
极差 (全距)
R=最大标志值-最小标准值
方差和标准差
方差
总体方差
每一项(各个数据-算术平均数的平方)的求和÷数据个数
样本方程
每一项(各个数据-算术平均数的平方)的求和÷数据个数-1
每一项【(组中值-算术平均数的平方)×分别频数】的求和÷所有频数的求和
每一项【(组中值-算术平均数的平方)×分别频数】的求和÷所有频数的求和-1
标准差
总体标准差
总体方差的开平方根
样本标准差
样本方差的开平方根
离散系数
概念
根据标准差来计算,也叫标准差系数
是一组数据的标准差与其相应的均差之比
是测度数据离散程度的相对指标
离散系数大,该组数据的离散程度大
离散系数小,该组数据的离散程度小
分布偏态与峰度的测度
偏态系数 SK
对数据分布不对称性的度量值
公式
每一项(各个数据-算术平均数)的求和÷数据个数×样本标准差的三次方
每一项【(组中值-算术平均数)×分别频数】的求和÷所有频数的求和×样本标准差的三次方
偏态系数为正值
右偏(正偏)
偏态系数为负值
左偏(负偏)
偏态系数为0值
分布对称
峰度系数 K
对数据分布峰度的度量值,峰度通常是与标准正态分布相比较而言的
如果服从标准正态分布
峰度系数为0
如果不服从标准正态分布
峰度系数不同于0
比正态分布更平
平峰分布
比正态分布更尖
尖峰分布
每一项(各个数据-算术平均数的四次方)的求和÷数据个数×样本标准差的四次方-3
每一项【(组中值-算术平均数的四次方)×分别频数】的求和÷所有频数的求和×样本标准差的四次方-3
峰度系数K<0
扁平分布
峰度系数K>0