导图社区 卫生统计学
统计大纲思维导图,介绍了数据分布的描述、 数据分布特征、 集中位置、 变异程度等。
社区模板帮助中心,点此进入>>
小儿常见病的辩证与护理
蛋白质
均衡饮食一周计划
消化系统常见病
耳鼻喉解剖与生理
糖尿病知识总结
细胞的基本功能
体格检查:一般检查
心裕济川传承谱
解热镇痛抗炎药
卫生统计学
绪论
总体与样本
population
某特定群体中的所有个体
sample
从总体中抽取的有代表性的个体
变量
定量变量 (quantitative variable)
连续变量(continuous variable): 年龄、身高、体重、血压…
变量的取值范围在理论上可以取到任意区间内的正实数(连续不断的),一般具有度量单位。
离散变量(discrete variable): 家庭人口数、脉搏
取值范围是间断而不连续的。
定性变量 (qualitative vatiable
有序分类变量:学历、检验结果(-,+,++,+++)
给人一种等级或顺序的感觉
无序分类变量
各个取值间没有程度的差异
二项分类变量:性别
多项分类变量:血型
第一章 数据分布的描述
频数分布表 (frequency table)
是什么
频数分布表表示将一组计量资料按观察值大小分为不同组段,然后将各观察值归纳到各组段中,最后清点各组段的观察值个数(称频数),以表格形式表示。
用来做什么
频数分布表便于进一步计算有关指标或进行统计分析,描述资料的分布特征和分布类型。
如何做
①找出最大值和最小值 ②计算全距R=最大值-最小值 ③确定组距(相邻两组之间的距离),组距=全距/组段数,通常组段数取8~12组 ④确定组段的上下限,第一组应包括数据中的最小值,最后一组包括最大值,最后一组要求写出上限。每个组段为半开半闭区间。 ⑤列表整理,计算各组段的频数、频率、累计频数、累计频率等。
概要
直方图
等距分组:常用
非等距分组:得到的频数往往不具备可比性
数据分布特征
分布形态
(近似)对称分布
人的很多生理、生化指标,如身高、体重、 胸围、血红蛋白含量、白细胞数等
右(正)偏态 ( right/positive skewness)
大多数重金属和微量元素在人体内的含量、 个人经济收入等
正偏态分布往往经对数变换后可呈现对称分布
左(负)偏态 ( left/negative skewness)
趋势
集中趋势 (central tendency)
指一组数据向某一中心值靠拢的趋势,反映了一组数据中心点的位置,是频数分布表和直方图中高峰所在位置,即频数最大的组段。
离散趋势 (dispersion tendency)
部分数据偏离中心位置,从各个组段的频数分布可以大致了解观测值偏离中心的程度,数据的这种变异特征称为离散趋势。
集中位置
算术均数(arithmetic mean)
一个变量所有观测值的和除以观测值的个数,反映一个变量所有观测值的平均水平,简称为均数。 均数主要适用于描述不含极端值的对称分布变量的平均水平,这时均数位于分布的中心位置。
均数主要适用于描述不含极端值的对称分布变量的平均水平,这时均数位于分布的中心位置。
几何均数
中位数
变异程度
极差
四分位数间距
方差
标准差
变异系数
主题