导图社区 统计学第三章数据的描述性分析
上海财经大学版统计学第三章知识梳理 划重点。所有的知识点都给大家整理出来了,方便大家备考时翻阅查看,需要重点记忆的地方已经用符号和不同颜色的字体给大家标注出来了,希望对大家备考有所帮助。
一瓶矿泉水换一个4.0,上海财经大学版统计学第七章知识点梳理,所有的知识点都给大家整理出来了,方便大家备考时翻阅查看,需要重点记忆的地方已经用符号和不同颜色的字体给大家标注出来了,希望对大家备考有所帮助。
一瓶矿泉水换一个4.0,上海财经大学版统计学第六章知识梳理。所有的知识点都给大家整理出来了,方便大家备考时翻阅查看,需要重点记忆的地方已经用符号和不同颜色的字体给大家标注出来了,希望对大家备考有所帮助。
上海财经大学版统计学第五章知识梳理。所有的知识点都给大家整理出来了,方便大家备考时翻阅查看,需要重点记忆的地方已经用符号和不同颜色的字体给大家标注出来了,希望对大家备考有所帮助。
社区模板帮助中心,点此进入>>
马克思主义原理
考研数学重点考点知识总结归纳!
数据结构
法理学读书笔记
思维导图带你认识马克思主义原理
建筑光学基本知识
考研英语一写作
教育学考研:教育学原理第八章教学内容整理
考研三步翻译技巧
东方文明古国的教育
第三章 数据的描述性分析
数据的三大特征
集中趋势
平均数
算数平均数
(加权平均数)
几何平均数
调和平均数
中位数
众数
离散趋势
异众比率
极差
四分位差
AD(平均差)
方差与标准差
标准差系数
形态
矩
偏度
峰度
五数概括与箱线图
相对数和绝对数
绝对数
绝对数(亦称总量指标)是统计资料经过汇总整理后得到的反映总体规模和水平的总和指标
非百分比的数值一般都是绝对数,绝对数一般会有一个实际的单位
作用
反映一个国家的国情和国力,一个地区或一个企业的人力、物力、财力
是进行经济核算和经济活动分析的基础
是计算相对指标和平均指标的基础。
分类
按反映总体的内容分
变量总值
单位总数
按反映的时间状态分
时期数
时点数
按计量单位分
实物量
价值量
相对数
相对数是用两个有联系的指标进行对比的比值,可以反映现象的数量特征和数量关系,并可将现象的绝对差异抽象化,使原来不能直接相比的绝对数可以进行比较。
基本为百分数,一般没有单位(无名数)
也有一些用复名数(复合单位)来表示
计划完成相对数
结构相对数
比较相对数
强度相对数
动态相对数

应用原则
正确选择对比的基数
必须注意统计的可比性
相对指标要与总量指标相结合
相对数分析与绝对数分析结合
集中趋势的测定
表明同类现象在一定时间、地点、条件下所达到的一般水平,是总体内某个变量大小各异的观察值的代表性数值。也是对变量分布集中趋势的测定
权数(Weight),是分布数列中的频数或频率。对求平均数具有权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。
频率分布变了,均值也变。因此,严格地说, 权数应指频率
平方平均数>算术平均数>几何平均数>调和平均数(最保守)
环比的时候一般会用几何平均数
里面的pie符号是累乘符号
计算公式用于直方图算中位数(就是确定组之后等分来算)
(n+1)/2(若n为偶数,则为相邻两数的算数平均数)
更适合用于定性数据,对于一个定量的或者是连续性变量,众数的意义就不大了 不具有唯一性
计算公式:首先选择次数最多的组,众数在这组中 u为上限,l为该组下限,d1为该组与前一组的次数差, d2为该组与后一组的次数差,i为该组组距
位置平均数与算数平均数的关系
适用
算术平均数只适用于定量数据
众数适用于所有的定性数据和定量数据
中位数适用于定性数据中的定序数据和定量数据
定量数据
若是钟形分布,三种集中趋势指标一般 都可适用。而对J形分布,反J形分布和U形分布,中位数和算术平均数没有任何意
在确定集中趋势指标的过程中,算术平均数比中位数和众数使用了更多的数据信息
对于钟形分布且数据量很大时,三种集中趋势指标有如下三种数量关系:
应用平均指标的原则
1. 必须是同质的量方可平均
2. 总平均数与组平均数结合分析
3. 集中趋势与离散趋势结合分析
离散趋势的测定
标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标
反映变量分布的离散趋势
是对平均数的代表性程度的量度
离散程度越大,代表性程度越低
是对事物发展均衡性的量度
极差有单位,与方差有一个近似的关系,算好极差倒算方差时候能很快 四分位数有三个数值,是因为把整个数据分为4段。怎么找:先找中位数,再从两段里分别找中位数
例如,共50个数据,则中位数位第25.5个数,Q1为第13(1+25)/2个数,Q3为第38 (26+50)/2个数
方差用到了每一个点的数值,因此最能够反映离散程度。 考试一般情况下算方差都是第二个式子算
方差和标准差都是有单位的,如果原数据的单位是A,则方差的单位是A^2,标准差的单位是A。
没有单位 越小说明数据越集中,越大说明越离散
数据的形态测定
一阶原点矩为样本均值
一阶中心矩默认为0
二阶中心矩是方差
偏度系数
<0负偏态
=0对称分布
>0正偏态
峰度系数
<3平顶曲线
=3正态曲线
>3尖顶曲线
EXCEL输出结果的时候已经减去了3
箱线图中的min max并不一定是真正的最大最小值,是去掉了极端值的最大最小值 箱线图可以帮忙看左右偏 箱线图能够帮你确定是否有异常值,如果箱线图外面有散点的话就有异常值