导图社区 定量资料的统计描述
定量资料的统计描述的思维导图,整理了统计描述的概念、频数分布表和频率分布图、集中趋势的描述、离散趋势的描述的内容,希望对你有帮助。
卫生统计学 第一章 绪论的思维导图,整理了卫生统计学、若干基本概念、变量与资料类型、医学统计学的基本内容的内容,希望对你有帮助。
毒理学 第一章 绪论(1)的思维导图,毒理学研究外源化学、物理和生物因素对生物体和生态系统的损害作用与机制,以及中毒的预防、诊断和救治的科学。
社区模板帮助中心,点此进入>>
英语词性
法理
刑法总则
【华政插班生】文学常识-先秦
【华政插班生】文学常识-秦汉
文学常识:魏晋南北朝
【华政插班生】文学常识-隋唐五代
【华政插班生】文学常识-两宋
民法分论
日语高考動詞の活用
定量资料的统计描述
统计描述的概念
统计描述:采用统计指标、统计表和统计图的方法,对资料的数量特征或分布规律进行描述和测量
统计描述的三种方法:统计指,标统计表,统计图
统计描述是统计分析的最基本内容
频数分布表和频率分布图
💡计量资料频数分布表的编制
(1)求极差(全距)
符号:R
定义:最大值和最小值的差
(2)确定组数
原则:既简化资料,又不影响反应资料的规律性
(3)确定组距
每组的上限与下限之差
实际中组距=R/(预计的组数)
(4)确定各组段的上下限
原则:第一组包含最小的观察值,最后一组包含最大的观察值
组合组之间不能互相包含
X表示数据,则下限≤X<上限
(5)统计各组段的频数
💡频数分布图:连续性定量变量的频数分布图也称为直方图
频数密度=频率/组距
📝频数分布表和频数分布图的用途
揭示资料的分布类型
揭示分布的集中趋势和离散趋势
便于发现一些极大值或极小值
资料的分布类型
正态分布
偏态分布
正偏态(右偏态):右侧脱尾
负偏态(左偏态):左侧脱尾
集中趋势的描述
集中趋势:指一组数据项目与中心值共同的趋势,反应一组数据中心点的位置是频数分布表和直方图中高峰所在位置,即频数最大的组段
离散趋势:部分数据偏离中心位置,从各个组段的频次分布,大致了解观测直离中心的程度
平均数:描述一组同质计量资料的集中位置或平均水平
算术均数
用于描述正态分布或近似正态分布资料的集中位置
计算方法
1.普通法
2.加权法(频数表法)
几何均数
表示:G
适用于成等比级数的资料,如抗体滴度、血清凝集效价等;对数转化或呈正态分布的资料,如某疾病的潜伏期,某些微量元素在体内含量细菌计数,农药残留量等
中位数
记为M,是将一组观察值按大小顺序排列后,位次居中的观察值
适用条件:明显的偏态资料分布,类型不明的资料,一端或两端无界的资料
中位数指数位置居中数值波动的影响不易受极端值的影响
百分位数
符号: Px
性质:一种位置指标
意义:百分位数Px将全部数据分为两部分,使得有X%的数据小于Px,1-X%的数据大于Px
💡比较
均数:易受极端值的影响,反映所有数据的取值平均水平
中位数:不易受极端值的影响反映取值的中心位置
对于正态分布资料,均数和中位数理论上数值相等
📝离散趋势的描述
变异指标
描述一组计量资料数之间参差不齐程度的指标
极差
计算:R=最大值-最小值
适用条件:各种分布类型的资料用于资料的粗略分析
统计学意义:极差越大,数据的变异程度越大,越分散
缺点:受样本量影响较大,一般样本量增大,极差变大。样本量相同时不同,抽样得到样本的极差不同,极差的稳定性较差
四分位间距
Q= Q ₃-Q ₁=P ₇₅-P ₂₅
下四分位数Q₁=P₂₅;上四分位数Q₃=P₇₅
四分位数Q是中间一半观察值的极差
意义: Q越大说明数据间的离散程度越大
适用条件:偏态资料,分布类型不明,或两端无确切值的资料
方差
符号:σ²-总体方差 S²-样本方差
方差单位是元数据单位的平方
方差越大,观察值的变异就越大
适用条件:对称分布,尤其是正态(近似)分布
标准差
符号:σ-总体标准差 s-样本标准差
标准差越大,观察值的变异就越大,数据越分散,均数的代表性越差;反之资料越集中,均数的代表性越好
变异系数
计算
性质:描述相对离散程度,没有单位
可用来比较度量衡单位不同的资料的变异度
变异系数越大,数据的变异程度越大