导图社区 数值变量资料的统计分
关于数值变量资料的统计分思维导图,主要包含数值变量资料的频数分布、 集中趋势的描述、 离散趋势的描述等。
社区模板帮助中心,点此进入>>
数值变量资料的统计分
数值变量资料的频数分布
编制频数分布表和绘制频数分布图
计算极差(全距):R=最大值和最小值的差
确定组段数、组距和组段(组段只包含下限值不包括上限值)
列表
频数分布表和频数分布图的用途
直观
描述特征
发现可疑值
集中趋势的描述
算术均数
直接法
直接相加之和除以观察例数所得的商即为该组资料的均数
加权法
首先将数据编制成频数表,得出每组段的频数大,由相邻两个组段的下限之和除以2可求出各组 段的组中值(class mid-value) ,代人公式(11-2),求出均数。
几何均数
中位数和百分位数
百分位数(percentile)是一种位置指标。将八个观察值从小到大排列,分成100 等份,各等份含1%的观察值,则第二 百分位次对应的数值称为第,百分位数,用戶,表示。全部数据中比尸,小的有 2% 的观察值,比尸,大的有(100一1)% 的观察值。显然中位数以 即第50 百分位数(P0)。百分位数是用于描述观察值序列中某百分位置的水平,常用于确定参考值范围(见本章第二节)。百分位数也可用于描述各种频数分布的资料,多个百分位数结合应用时,可以较全面地概括观察值的分布特征,包括集中趋势与离散趋势。
当样本含量不大时,可将n个观察值由小到大顺序排列
当为奇数时,则中位数即位次居中的那个数值
当为偶数时,则中位数即位次居中的那个数值
频数表法
离散趋势的描述
全距(R):极差
R越大,离散越大.(和其他指标一起使用更科学)
四分位间距用 Q 表示,就是上四分位数与下四分位之差)即P75-P25.对p75来说,有百分之25的观察值大于他,称为上四分位数。四分位数间距越大,离散程度越大。)一般和中位数一起描述非正态分布的分布特征。
方差(yeriance)是描达所有观察值与均数的平均盛散程度的指标,表示一组数据的平均腐散 程度。
总体方差
样本方差
标准差是方差的算数平方根
标准差的用途:1.标准差越大,变量值分布越分散,均数的代表性越差,反之亦然:②用于计鲜空异系数:③用于计算标准误:(错合均数与正态分和的规律4.估计均数与正态分布的规律
变异系数:标准差与算数均数的比值
浮动主题