导图社区 统计量描述数据
这是一篇关于统计量描述数据的思维导图,知识内容有集中趋势的测度、离散程度的测度、数据分布形状的度量,值得收藏学习哦!
误差计量或测定中的误差是指测定结果与真实结果之间的差值。下图讲述了统计学与数据中数据误差的知识点,收藏下图学习吧!
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
统计量描述数据
集中趋势的测度
平均数容易受极端值的影响。左偏分布(负偏态):众数>中位数>均值。 右偏分布(正偏态):均值>中位数>众数。
平均数
算术平均数
几何平均数:用于计算比率等相对数的平均数;n个比率乘积的n次方根
都分为加权和简单
中位数
分位数
十分位数:将数据按照大小顺序排序后,把数据分割成十等分的九个分割点上的数值,共九个数值,为第一十分位数、第二十分位数···;
众数
离散程度的测度
异众比率:非众数组的频数占总频数的比率
极差(全距)
四分位距:上下四分位数之差
平均数差(平均绝对差MAD):一组数据与其均值之差的绝对值的平均数
方差和标准差:变量值与其均值离差平方的平均数
离散系数
因为标准差的大小会受到数据本身数值大小或计量单位不同的影响
称为变异系数、标准差系数;将一组数据的标准差初以其均值
标准分数
标准化值或Z分数,测定某一数据在该组数据中的相对位置
变量值与其平均数的离差除以标准差
数据分布形状的度量
偏态系数
公式:
SK>0是正偏或右偏
峰态系数
峰度系数为0,则是正太分布
表格描述数据
数值型频数分布表
分组:确定组数,公式:
确定组距:组距=全距/组数
是否能区分总体内部各个组成部分的性质差别,如:按成绩分组需要有60分组限
准确、清晰反映总体单位的分布特征,如:分析收入时采用不等距的分组方法,因为只有少数人是高收入群体
统计各组频数得出频数分布表
非数值型频数分布表
图形描述数据
直方图
横坐标代表变量各组的界限,纵坐标代表各变量值出现的频数或频率;
矩形面积代表各组的频数分布,但对于不等距分组纵轴必须是频数密度(=频数/组距)
箱线图
盒式图、盒须图;用于描述数据分布特征,常用于显示未分组原始数据的分布。
茎叶图
反映原始数据分布的图形,看出数据的分布形状以及数据的离散状况
折线图
表示描述的变量在一段时期内变动情况的图形,显示时间数列的数据,以反映事物发展变化的规律和趋势
气泡图
展示三个变量之间的关系,第三个数值用气泡大小表示
雷达图
散点图
观察两个变量之间的相关程度和类型最直观的办法
条形图
用宽度相同的条形高度或长短来表示数据变动,用于观察不同类别数据的多少或分布情况,有单式条形图和复式条形图。
饼图
利用圆形及圆内扇形面积来表示数值大小的图形,表示样本中各组成部分的数据在全部数据中的比重,主要用于结构性问题的研究,如消费结构、性别结构
环形图
帕累托图
按照各类别数据的频数多少排序(根据频率降序排序),并绘出累积百分比