导图社区 统计学第四章数据的概括性度量
这是一篇关于统计学第四章数据的概括性度量的思维导图,数据的概括性度量是统计学中重要的分析工具,它通过集中趋势、离散程度方面的度量,为我们提供了理解和分析数据的有效手段。在实际应用中,我们需要根据数据的类型和特点,选择合适的度量方法,以便更好地揭示数据的内在规律和特征。
这是一篇关于统计学第三章数据的图表展示的思维导图,介绍了塔夫特五条鉴别图形优劣的准则,这是评估图表质量的重要参考标准,包括清晰性:图表应当清晰明了,易于理解。准确性:图表应准确反映数据的真实情况。简洁性:图表应当简洁,避免冗余信息。相关性:图表的内容应与主题紧密相关。一致性:图表应保持一致的格式和风格。
这是一篇关于统计学第二章数据的搜集的思维导图,详细介绍了简单随机抽样、分层抽样、整群抽样、系统抽样和多阶段抽样等常见方法,并解释了它们的基本原理。概率抽样的优点在于可以根据调查结果计算估计量误差,从而推断总体目标量的可靠程度。涉及了抽样误差和非抽样误差的概念。抽样误差是由抽样的随机性引起的样本结果与总体真值之间的差异,它不可避免但可以通过增大样本量等方法进行调节。非抽样误差则是由除抽样误差之外的其他因素引起的,包括抽样框误差、回答错误、调查员误差和测量误差等,这些误差是可以通过一定措施避免的。
社区模板帮助中心,点此进入>>
英语词性
法理
刑法总则
【华政插班生】文学常识-先秦
【华政插班生】文学常识-秦汉
文学常识:魏晋南北朝
【华政插班生】文学常识-隋唐五代
民法分论
日语高考動詞の活用
第14章DNA的生物合成读书笔记
统计学第四章数据的概括性度量
集中趋势的度量
分类数据:众数(可能计算)
众数是一组数据中出现次数最多的变量值,用M0表示。
主要用于测度分类数据的集中趋势,也可用于顺序数据和数值型数据
一般情况下,数据量大时,众数有意义
众数不受数据中极端值的影响。众数可能不存在,可能有多个【10个数中最多可以出现4个众数】
顺序数据:中位数和分位数(可能计算)
中位数:
概念:是一组数据排序后处于中间位置上的变量值,用Me表示
中位数不适用于分类数据
中位数位置公式和中位数计算公式
手写笔记
四分位数:
概念:也称四分位点,一组数据排序后处于25%(下四分位数)和75%(上四分位数)位置上的值,三个点将全部数据分为四个部分,每部分包含25%的数据。
计算公式
数值型数据:平均数(可能计算)
简单平均数
加权平均数
几何平均数
众数中位数和平均数的比较
三者的关系(图示加说明,见笔记)
三者的特点和应用场合
众数:是一组数据分布的峰值,不受极端值的影响,众数只有在数据量多时才具有意义,当数据量较少时,不适合使用众数。
中位数:是一组数据中间位置上的值,不受极端值的影响
平均数:是针对数值型数据计算的,而且利用了全部的数据信息,它是应用最广泛的集中趋势测度值。
选择:
数据呈对称分布或接近对称分布,三个代表值相等或接近相等,选择平均数作为集中趋势的代表值。
数据为偏态分布时,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时他们的代表性比平均数好。
离散程度的度量
分类数据:异众比率
指非众数组的频数占总频数的比例,用Vr表示,公式为(见手写笔记)
异众比率越大说明非众数组的聘书站总频数的比重越大,众数的代表性越差。
顺序数据:四分位差
也称为内距或四分间距,是上四分位数与下四分位数之差,用Qd表示
反应中间50%的数据的离散程度,数值越小说明中间的数值越集中。
不受极值影响,在一定程度上能反映中位数对一组数据的代表程度。
数值型数据:方差和标准差(大概率计算题)
极差:一组数据的最大值与最小值之差,称为极差也称全距,用R表示。公式为(见手写笔记)
平均差:也称平均绝对离差,是各变量值与其平均数离差绝对值的平均数,用Md表示。公式为(见手写笔记)
方差和标准差:
方差是各变量值与其平均数离差平方的平均数,方差的平方根称为标准差。
公式为(见手写笔记,需要区分是总体还是样本,如果是总体需要除以N;如果是样本需要除以n-1)
自由度:样本方差是用样本数据个数减1后去除离差平方和,其中样本数据个数减1即n-1称为自由度。
单位:标准差和数据组的单位一致,但是方差没有单位。
相对位置的度量
标准分数(重要)
变量值与其平均数的离差除以标准差后的值称为标准分数,也称为标准化值或z分数。
公式为(见手写笔记)
经验法则(钟形分布)
重要:见手写笔记
相对离散程度:离散系数
也称为变异系数,是一组数据的标准差与其相应的平均数之比(标准差有单位),Vs=s/x拔
离散系数越大,说明数据的离散程度也大
偏态与峰态的度量
给个数让判断是左偏还是右偏
偏态
偏态系数等于零=这组数据分部对称
偏态系数大于1或者小于-1=这组数据为高度偏态分布
偏态系数在0.5到1或-1到-0.5之间=这组数据为中等偏态分布
偏态系数越接近于零=这组数据偏斜程度就越小
=0不偏;大于0右偏;小于零左偏
峰态
峰态是对数据分布平峰或尖峰程度的测度
标准正态分布,峰态系数的值为零
尖峰分布,平峰分布图示
峰态系数大于零时为尖峰分布,数据的分布更集中,小于零时为扁平分布,数据的分布更分散。