导图社区 统计学第四章
贾俊平统计学第四章
贾俊平统计学第七章的知识导图,内容包含了参数估计的概念、一个总体参数的区间估计方法、两个总体参数的区间估计方法等。
统计学思维导图:包含统计量,其作用是把样本中有关总体的信息汇集起来;是数理统计学中一个重要的基本概念。等等
社区模板帮助中心,点此进入>>
《老人与海》思维导图
《钢铁是怎样炼成的》章节概要图
《傅雷家书》思维导图
《阿房宫赋》思维导图
《西游记》思维导图
《水浒传》思维导图
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《红星照耀中国》书籍介绍思维导图
英语词性
统计学第四章
数据分布的特征
集中趋势(众数、中位数、分位数、均值、几何平均数、切尾均值)
集中趋势又称“数据的中心位置”、“集中量数”等。它是一组数据的代表值。集中趋势的概念就是平均数的概念,它能够对总体的某一特征具有代表性,表明所研究的舆论现象在一定时间、空间条件下的共同性质和一般水平
离散程度(极差、内距、方差和标准差、离散系数)
离散程度是指通过随机地观测变量各个取值之间的差异程度,用来衡量风险大小的指标
分布形状(偏态及其测度、峰度及其测度)
偏态是指非对称分布的偏斜状态。峰度又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭。反之亦然
集中趋势度量
平均数
是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。它是反映数据集中趋势的一项指标
算术平均数
在一组数据中所有数据之和再除以数据的个数
几何平均数
n个观察值连乘积的n次方根就是几何平均数
加权平均数
加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算
中位数和分位数
中位数
中位数又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分
n为奇数
n为偶数
四分位数
四分位数四分位数,是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,它是一组数据排序后处于25%和75%位置上的值
上四分位数
Q1的位置= (n+1) × 0.25
下四分位数
Q3的位置= (n+1) × 0.75
众数
众数是在一组数据中,出现次数最多的数据
根据平均数、中位数、众数判断数据分布
易受极端值影响
数学性质优良,实际中最常用
数据对称分布或接近对称分布时,代表性最好
不受极端值影响
数据分布偏斜程度较大时,代表性较好
具有不惟一性
数据分布倾斜程度较大且有明显峰值时,代表性最好
离散程度度量
全距
极差又称范围误差或全距,以R表示,是用来表示统计资料中的变异量数,其最大值与最小值之间的差距,即最大值减最小值后所得之数据
R=max(x)-min(x)
四分位差
四分位差,它是上四分位数(Q3,即位于75%)与下四分位数(Q1,即位于25%)的差
Q =Q3-Q1
方差
原始数据(样本方差)
分组数据(加权样本方差)
标准差
原始数据(样本标准差)
分组数据(加权样本标准差)
离散系数
又称变异系数,是一组数据的标准差与其相应的平均数之比,是衡量资料中各观测值离散程度的一个统计量
离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小
标准分数
也叫z分数,是某个数据与其平均数的离差除以标准差之后的值
z=(x-μ)/σ;其中z为标准分数;x为某一具体分数,μ为平均数,σ为标准差
它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差
特点
z分数的平均等于0
其标准差等于1
经验法则(数据对称)
切比雪夫不等式(数据不对称)
分布形状度量
偏度系数(SK)
描述分布偏离对称性程度的一个特征数
当分布左右对称时,偏度系数为0
当偏度系数大于0时,即重尾在右侧时,该分布为右偏
当偏度系数小于0时,即重尾在左侧时,该分布左偏
当偏度系数小于-1或者大于1时,属于高度偏态分布
当偏度系数大于1,小于0.5或者大于-1,小于-0.5时,属于中度偏态分布
根据原始数据计算
根据分组数据计算
峰度系数(K)
峰度又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度
当峰态系数等于0时,扁平峰度适中(标准正态分布)
当峰态系数小于0时,为扁平分布(数据相对分散)
当峰态系数大于0时,为尖峰分布(数据相对集中)