导图社区 卫生统计学 赵耐青版-上
卫生统计学思维导图,涵盖前六章正文内容及其课后习题。清晰全面阐释了主要疑难与逻辑抽象点。皆是精华。
编辑于2022-04-21 20:43:06内涵PA7E四模块考点汇总大全(参照光环VIP课汇总)、配套高模拟度试题错题汇总、应试详细技巧(人员过程环境高频考点应试公式、考点识别、技巧汇总)。
该导图包含了数据管理计划、数据核查计划、数据核查、质疑管理、数据传输与整合、外部数据管理、数据管理人员分工及数据库相关内容。
出版社: 机械工业出版社 译者: 渠海霞 本书用“青年与哲人的对话”这一故事形式总结了与弗洛伊德、荣格并称为“心理学三大巨头”的阿尔弗雷德·阿德勒的思想(阿德勒心理学)。风靡欧美的阿德勒心理学对于“人如何能够获得幸福”这个哲学问题给出了极其简单而又具体的“答案”。了解了足以被称为“这个世界上的一个真理”的阿德勒思想之后,你的人生会发生什么变化呢?又或者,什么都不会改变? 来吧,让我们与青年一起走进这扇“门”!
社区模板帮助中心,点此进入>>
内涵PA7E四模块考点汇总大全(参照光环VIP课汇总)、配套高模拟度试题错题汇总、应试详细技巧(人员过程环境高频考点应试公式、考点识别、技巧汇总)。
该导图包含了数据管理计划、数据核查计划、数据核查、质疑管理、数据传输与整合、外部数据管理、数据管理人员分工及数据库相关内容。
出版社: 机械工业出版社 译者: 渠海霞 本书用“青年与哲人的对话”这一故事形式总结了与弗洛伊德、荣格并称为“心理学三大巨头”的阿尔弗雷德·阿德勒的思想(阿德勒心理学)。风靡欧美的阿德勒心理学对于“人如何能够获得幸福”这个哲学问题给出了极其简单而又具体的“答案”。了解了足以被称为“这个世界上的一个真理”的阿德勒思想之后,你的人生会发生什么变化呢?又或者,什么都不会改变? 来吧,让我们与青年一起走进这扇“门”!
中心主题
第一章 绪论
引言
Statistics定义
一门研究数据收集、整理、分析、推断等的学科。
统计学包括内容
参与随机现象研究的设计、观察(或测量)和资料的收集,并初步处理一些与统计学相关的问题或提出建议
根据概率论和数理统计学原理和方法对收集的资料进行统计分析并做出统计推断或统计预测等
为什么生物医学研究需要统计学?
生物医学研究中的观察结果具有随机性 其观察指标测量和资料收集等均涉及统计学
Biostatistics?
生物统计学。国际统计学界将生科实验研究、基础医学研究、临床医学研究和预防医学研究中的统计学内容统称为生物统计学。 其各自侧重点不同,故生科的更多叫生物统计学 基础和临床的叫医学统计学,预防的为卫生统计学。 但其内容各自重叠渗透,工作中很难区分其实际差距
第一节 统计学中几个基本概念
1||| 观察单位 observation unit
观察单位。根据研究目的所确定的最基本的抽样单位,其也称为个体(individual)
2||| 总体 population
总体,是根据研究目的确定的所有同质个体某指标实际值的集合。 (为叙述方便往往简单称总体为根据研究目的所确定的所有同质观察对象的全体。 具体怎么个同质法取决于研究目的人群
finite population
有限总体,限定于特定时间、空间范围的总体,其总体个数有限。
infinite population
无限总体,无明确的时空限制的总体,其个体总数为无限。 许多研究目的对应的有限总体个体数非常庞大,与无限总体在应用中无差别,故把个体总数非常大的有限总体视为无限总体。 但这二者又有何应用差别?
3||| 同质性 homogeneity
homogeneous
指观察单位具有相同性质。
heterogeneous
指观察单位具有不同性质。
4||| 样本 sample
样本 从一个研究问题所确定的研究对象中抽出一部分个体,对某些研究指标进行观察或测量,这些个体研究指标的测量值构成的集合称为样本 样本总数称为sample size,样本量
5||| 变量 variable
变量/观察指标。 变量的取值即为观察值/测量值或对应的观察结果,也成为资料data? variable的取值构成data
random variable
随机变量,简称变量。
random
随机的。 医学观察结果在观察前往往是未知的;即使同条件下重复观察,其结果往往也不同,所以称这种观察结果是随机的random。
根据变量取值特征不同分类
总共就三大资料。 定量/计量资料(可测量+有单位)(计量资料不一定连续 计数资料(无序分类下个体数 等级资料(等级分类下个体数
连续型 continuous
连续型变量,可在一个区间中任意取值的变量。(且通常含有测量单位
计量资料 measurement data
计量资料
离散型 discrete
离散型变量。变量取值范围是有限个值或一个数列。
非分类 non-categorical
不具分类性质的离散性资料。 有些资料如白细胞计数,其取值虽然离散,但不具有分类性质。通常将此类资料按计量资料算。
分类 categorical
表示分类情况的离散型变量
二分类 dichotomous
二分类资料。观察可能的结果只有两个 别称:0-1变量(通常变量取值0&1对应两种可能结果 对应资料为0-1资料 由于其有序和无序情况在统计分析方法上相同,故二分类资料一般不分有序和无序,一般均归类为无序分类资料
无序多分类nominal
无序多分类资料。该变量取值无分大小,仅为区分不同类别。 如:血型分型
各类下计数整理后又可称为 计数资料-enumeration data
无序分类资料可先按类汇总,后统计每一类个体数,后汇总为表格,这种资料也可称为计数资料。
有序多分类 ordinal
有序多分类资料。观察结果具有程度或等级上的差别。
汇总成为 等级资料
关于资料类型间的转化
分类上的进一步细分,是不可逆的。
即Quantitative data可转为ordinal,ordinal可转为dicho,但倒回来不行
6||| 随机事件 random event
随机事件,概率论中把结果具有随机性的观察或实验统称为随机试验。 随机试验的每种可能结果为随机事件,简称即event事件。 与必然事件相区分
7||| 频率 frequency
频率。频率为比值,频数为分子,总次数为分母。 频率f呈随机波动状态,但当测试总次数n趋近于正无穷时,f趋近于一个常数Π(该事件发生概率 即频率为样本估计概率,概率为事件发生真实概率(总体参数)。
8||| 概率 probability
概率。描述某随机事件可能性大小。取值0-1
小概率事件
p≤0.05、 一般认为小概率事件在一次随机抽样中不会发生。
9||| 总体参数 parameter
总体参数,用于描述总体特征的指标。
10||| 统计量 statistic
统计量,刻画样本特征的统计指标。
11||| 个体变异 individual variation
个体变异,同质个体中同一指标个体观察值的差异。
变异分布规律
个体变异是随机的,而同质个体的变异在概率意义下有规律可循。 这种随机变异的规律性为该观察指标取值的概率分布。 任何随机现象都有其固定的分布规律,即概率分布。
12||| sampling error & sampling distribution
抽样误差: 为什么样本统计量估计总体参数往往存在误差?这是由于随机抽样和个体变异存在的原因。这之间存在的差异叫抽样误差。(抽样误差也可体现在两个样本统计量之间) 个体变异使得抽样误差普遍存在,但抽样误差也有规律,可通过增大样本量减少其误差。 抽样分布:指样本统计量的概率分布。(在同一总体中进行大量独立重复可呈现样本统计量的抽样分布)
第二节 医学研究中的统计问题和设计问题
got nothing to say
第三节 卫生统计学方法与数据统计分析
got nothing to say
第四节 基本概念辨析
1. 小概率事件在一次随机抽样中不会发生
2. 总体感染率问题
3. 定量资料包含了计量资料和部分离散型资料(非分类部分)
定量泛指带数字的指标。 所以离散数据的非分类部分即计数资料,也是定量的一部分
4. 个体随机变异值计算
实测值与总体均值相差
第二章 统计描述
资料收集后进行统计分析,统计分析分为 统计描述和统计推断。 统计描述主要任务:刻画资料的基本统计特征。(通过其基本特征了解研究对象基本概况。 统计描述主要包括:资料分布、平均水平和离散程度。
第一节 定量资料的统计描述
I. 定量资料的频数表和频数图
编绘
编制频数表的步骤
1. 求Range
range/全距/极差。一组资料中最大最小值的差值。R表示
2. 确定组段数和组距
组段数
不当情况
样本量较小而组段数过多:一些组段中频数过少甚至为0
样本量较大而组段数过少:掩盖资料分布规律
取值
一般情况取8-15
组距
估计值
常用R/预计组段数
各组段组距一般相同
3. 确定各组段上下限
各组段起终点为上下限。各组段组中值class mid-value=上下限之和/2
区间开闭
处最后一个组段为闭区间外,其余下限和上限构成左闭右开的区间。[1,2)
需注意
(1) 首组段应包括最小观察值,且为整齐数字,末组段包括最大值
(2) 最末组段写出上下限,其余表示为:上限~
4. 统计各组段频数和频率,编制出频数表
频数图
各组距不等时一般用频率密度图表示资料分布
用途
1. 可揭示资料分布类型
对称分布
非对称/偏态分布
右/正偏态:频数集中在小数值位置(高开低走
左/负偏态:高走
此处关于“偏”的释义
此处的偏不是偏向toward,而是偏离skew。 此处的左偏意为mean在mode左边,图像中峰偏向右侧,峰偏离左侧。 即mode峰离开了本应位于的mean上
2. 显示频数分布2重要特征
central tendency
频数较集中的组段趋势称为集中趋势
dispersion tendency
频数由集中组段渐少的趋势
3. 发现某些特大/小可疑值
4. 便于进一步统计分析
II. 集中趋势的描述
描述指标除了常用的算术均数、几何均数和中位数外,还有众数、调和均数等
均数 arithmetic mean/mean
算术均数,简称均数。
适用资料
适用于描述 对称/近似对称分布资料的集中趋势
分类
总体均数μ
是根据研究目的所确定的全体研究对象的某指标观察值的平均水平。
样本均数Xbar
指研究所收集的对象某指标值的算术平均数。
计算
原始数据
频数表资料
几何均数 geometric mean
几何均数,G
适用资料
适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态/对称分布)的资料,以及等比数列资料
如呈对数对称分布的滴度资料
计算
原始资料
频数表
算术均数一定大于等于几何均数
中位数 median
中位数,一个平均水平指标。样本中位数即位次居中的值。 总体中位数意义:50%观察值≥总体中位数,50%观察值≤总体中位数。
计算
适用资料
任何分布的定量资料
对称分布资料,median=mean
对数变换下对称分布,median=G
开口资料
即无确切最大值/最小值的资料
百分位数 percentile
III. 离散趋势的描述
方差 variance, S²
方差,变量值与总体均数之差平方的平均值,描述了全体研究对象取值的平均离散程度。
计算
标准差 standard deviation, S
标准差
计算
适用资料:近似对称分布的样本资料
方差标准差描述资料在样本均数位置的离散程度,而样本均数适用于近似对称分布资料。
极差 range
全距/极差。
缺陷所在
仅利用了最大最小值信息,不能较好反映资料变异情况
样本量越大R可能越大,故R不稳定
四分位数范围 IQR
inter-quartile range,四分位数范围:(P25,P75),描述中位数左侧25%和右侧25%观察资料的分布范围。
四分位数间距?
四分位数范围的长度称为四分位数间距? 如P75-P25, 四分位数间距即为中间50%其刻画了中位数两侧50%观察资料的离散程度。
稳定性优于R,对偏态资料而言是个较好的统计描述指标
但一般不孤立使用四分位数间距描述离散程度,不能良好反应偏态资料的离散程度
变异系数 CV
coefficient of variation,变异系数
若各组资料的量纲不同或均数相差悬殊,宜用CV比较各组间变异度
一组比身高一组比体重的变异度:属于量纲不同 一组比成人身高,一组比婴儿身高,属于均数差距悬殊
第二节 分类资料/相对数的统计描述
I. 分类资料频数表
II. 分类资料描述常用统计量
常用比、比例和率等统计量描述,因此常称为相对数统计量,简称相对数relative number.
ratio
比/相对比,俩有关指标之比。 比值。
proportion
比例/百分比,某时点事物内部各组成部分所占的比重。 更多表示为构成比。
rate
率,具有时期概念的指标:某时段内某现象发生的频率或强度。
III. 应用相对数的注意事项
分母不宜过小
抽样误差较大
根据研究设计和问题选择指标
勿随意合并多个样本率
比较相对数时注意可比性
影响因素内部构成是否相同
各组观察对象等因素要同质
IV. 率的标准化
标准化目的和基本思想
目的:控制变量
standardization
基本思想
选择代表性人群作为参照人群
直接标化方法
间接标化方法
第三节 统计表与统计图
常用统计表 statistical table
统计表结构与编制
结构
列表原则
重点突出,简单明了
即每个表只表达一个中心内容,不要啥都涵盖进去
主谓分明,层次清楚
编制要求
种类
simple table
简单表,只按一个特征分组
combinative table
复合表,2+特征分组
常用统计图 statistical graph
根据研究目的和资料类型选择合适统计图
绘图基本要求
常用统计图的适用条件与绘制
bar graph
条图
有单式和复式两种
绘图要求
pie graph & percent bar
饼图和百分条图
主要用于构成比资料
line graph
线图 以线段升降表示连续型资料随变量取值的变化
semilogarithmic line graph
半对数线图
线图表示变化趋势
半对数线图表示变化速度
路程与速度的关系,还可以加个加速度变化
histogram
直方图
表示连续型资料频数分布
scatter diagram
散点图.通过直角坐标系中点的位置表示俩变量数量关系和变化趋势。
适用于描述俩变量之间关系
纵坐标选择
频数
频率
频率密度
频率/组距
第四节 基本概念辨析
滴度资料和几何均数
滴度资料常用G描述是由于其大都服从对数对称分布,若有个别呈偏态,则应概率中位数描述
百分位数指标与平均水平和离散程度
百分位数只是描述分布位置点。 可描述集中趋势:P50 可描述离散程度:P25-P75
incidence rate 范围
与流病概念相异。 这里说是指单位观察时间内新发病例数,其值可大于1.
间接标化死亡率与可比性
第三章 常用概率分布
伯努利是扔一次硬币 二项分布是多次伯努利,即扔多次硬币 泊松分布是p 很小的二项,即扔好多好多次硬币,且扔出正面概率极小 正态分布是p很大的二项,即扔好多好多次硬币,且硬币是完全相同的
第一节 二项分布
每次发生一个双结局事件都是一次Bernoulli试验。 一般情况为确定发生n次, 让你计算n次中某个结局出现0~n次的概率
I. Bernoulli试验
试验的可能结果为2个且每次试验仅出现其中一个结果,且在每次试验前不能确定将出现哪一个结果。 伯努利试验
II. 二项分布概率函数和概率分布
III. 二项分布的性质与特点
性质
特点
每次可能结果数为2,且相互对立排斥
成功概率均为Π,对立概率1-Π
n次重复Bernoulli试验结果相互独立
如何判断二项
1. 做某事次数固定
2. 每件事有2个结果
3. 每次成功概率相等
4. 我们想求的是成功x次的概率
IV. 二项分布图形
二项分布图形性状取决于n和π
只要π不太接近0或1,随n增大,其分布会近似对称
π为0.5时,其呈对称分布
第二节 Poisson分布
用于描述某随机事件A在单位时间/空间内发生次数X的概率分布。 (即已知某数值的平均水平,现计算该值为其他水平值的概率大小) 如某城市交通事故发生次数,某些罕见疾病发病人数等。
I. 概率函数和分布
II. 性质和特点
1. 属于离散型分布,μ为其总体参数(唯一参数
2. 其总体方差等于总体均数μ
独特的性质。用于推断随机变量是否属于泊松分布
3. 可加性
4. Poisson与二项分布关系
因此当n很大时,二项分布的概率计算常用poisson分布计算来近似。 泊松分布是p 很小的二项,相当于投魔术硬币,正面概率0.05。
5. 如何判断Poisson
1. 事件皆独立
2. 任意相同的时间范围内,事件发生概率相同
3. 我们想求得的是某时间范围内发生某次事情x次的概率多大
III. Poisson分布图形
μ较小时,Poisson分布是一个偏态分布;但当其μ增大时,其为逐渐趋于对称。
当μ≥20时,可认为泊松近似正态;当μ≥50时可认为泊松分布呈正态分布
IV. Poisson分布的条件
平稳性
即随机事件A的概率规律不随时间推移而改变。A发生次数与观察时间长短有关,与观察时间起点无关。
独立增量性(无后效性)
随机事件A在互不相交的时间区间内发生次数相互独立。
普通性
普通性保证随机事件A在一瞬间不可能发生多次。即充分小的时间内,A最多发生一次。
这中译名屎一样
第三节 正态分布
连续型变量一般用概率密度曲线研究随机变量可能取值的区间及其在该区间的概率。 Normal distribution又名为Gauss分布
I. frequency density chart
频率密度图
每块方条面积=频率
由于各组段频率和为1,故其面积和为1
当n越来越大时,各组段频率稳定趋近于其各自对应的概率
概率密度图→概率密度曲线
II. 正态分布概念
两个参数
μ
是正态分布的整体均数,正态分布曲线峰位置恰好为x=μ(故也为分布的集中趋势位置
σ
σ为正态分布总体标准差,体现在其离散程度。越小越集中图形越狭窄,越大越离散,图形越平坦。
III. 正态分布变量性质
1. x=μ两侧面积相等
即变量取到其范围内的概率均等,为50%
2. 变量取到x=μ附近概率较大
3. μ决定峰位置,σ决定胖瘦,只要确定μ和σ,概率曲线唯一确定
4. μ处f(x)取到最大值
IV. 正态分布变量的概率分布规律
如何确定变量落在任意区间的概率?
概率值为曲线下区间之间的面积。即只要确定了概率曲线(μ&σ),区间下面积即可计算
曲线下面积又如何计算?
正态分布密度函数的不定积分无法使用初等函数表示,需要对变量X进行标准化变换:Z=(X-μ)/σ 转换后的Z~N(0,1)为标准正太分布。
标准正态分布界值表
第四节 参考值范围
reference ranges. 最常用的正常人参考值范围是95%。
确定步骤
确定入选和排除标准
一般要求研究对象为体检正常的对象。 精确来说是指排除了影响所研究指标的疾病和有关因素的同质人群。
决定单双侧
双侧:某指标过大过小均为异常 单侧:仅过大或过小才是异常。
确定范围
95%最常用
根据资料分布情况利用正态分布法或百分位数法制定
第五节 基本概念辨析
1. 确定性事件与随机性事件
前者必然发生
2. 随机试验与随机事件
随机试验的任何一个结果均称为随机事件,简称事件。
3. 离散型随机变量分布与连续型随机变量分布
取值区别
离散变量取值可为有限或无限个。其所有可能的取值都可用一个序列表示。 而连续型变量在某区间内任何一个值都可以取到,特定区间内可取无限多值,其取值无法一一列出。
概率计算区别
离散型变量的概率分布可给出所有可能取值及每个值发生的概率。 而对于连续型变量,某点上的取值概率为0,只能求得某区间取值的概率,这需要用积分或查表获得。
4. 二项分布与两点分布
二项分布的试验次数n=1时,称为两点分布,其取值为0和1
5. 正态分布与对称分布
正态一定对称,对称不一定正态。
6. 医学参考值范围计算中的正态分布法&百分位数法
前者计算出的平均误差小于后者。 故如果资料服从正态,优先考虑正态分布法,否则才考虑用百分位数表示。
7. 实际研究中二项分布应用与独立性要求
独立性要求:n次重复Bernoulli试验结果相互独立 如果调查患某病人数,其可近似认为服从二项分布,但要求其为非传染性疾病,否则病例之间可能不独立存在关联。
第四章 抽样误差与抽样分布
第一节 样本均数和样本率的抽样分布
样本均数的抽样误差和抽样分布
抽样误差
样本均数的总体标准差与样本量、总体标准差的关系
即样本均数之间的波动幅度远小于原资料的波动幅度。
上式因总体参数未知的转化
Sx-bar:样本均数的估计标准误
受俩指标影响
抽样误差本来就受个体变异和样本量的影响
标准差S
原资料的个体变异大小影响抽样误差
样本量n
实际情况中采取增大样本量来控制抽样误差。
抽样分布
正态总体的样本均数服从均数和标准差为何的分布?
非正态总体的样本均数随n增加,其服从何分布?
central limit theorem, CLT
中心极限定理。 无需原分布为正态分布。
任何分布的样本均数均接近正态?
no. 只有分布的最大值小于正无穷,才满足(原分布需具有有限的期望和方差
哲学意义
即无论什么资料,其抽到的样本值算的均数都是中间的均数多,远边的均数少。
率的抽样误差和抽样分布
第二节 常用的抽样分布
t 分布
即借中心极限定理:任意分布的样本均数的分布均收敛于正态这一事实; 从而可借资料的样本均数套入进一个分布函数,该函数又是概率密度曲线,从而可知特定的样本均数落在特定区间的概率多少;也可通过算数减法求得两样本源于同总体的概率。
公式推导
概率密度曲线特征
横坐标t 纵坐标f(t)
1. t分布曲线形状仅与自由度ν有关
2. 中心位置于0上,均为中间高两边低左右对称
3. 与标准正态比更宽胖,其随ν增大而变窄;ν趋近∞时样本变为总体,此时t曲线即为标准正态曲线
4. t界值:tα,ν
意义
从t分布曲线上看出,从正态分布总体中抽出的样本,其计算的t值接近于0的可能性(曲线下面积)大,远离0可能性小
根据公式及上述推论可知样本均数X-bar接近总体均数的可能性较大,远离的可能性较小
用于判断某一总体中随机抽样所得样本均数的性质?
χ²分布
Z平方服从ν=1时的χ²分布
公式推导
ν为1?
χ²分布公式本身为一个累加,ν为1的话就只有一项,刚好为Z²
图形特点
其图形为一簇单峰正偏态,随着ν增加,正偏程度变小
意义
由ν=1到n-1累加后的公式
F分布
简介
推导
条件:两个总体方差相齐
特征
F分布含2个ν,F取值为(0,∞)
为一簇单峰正偏态分布曲线,形状与2个ν相关
F界值表
第三节 基本概念辨析
标准误与标准差
标准差刻画分布的离散程度;标准误刻画抽样误差大小 随样本不断扩大,标准差随机波动渐小,稳定在总体标准差附近;标准误也渐小,趋近于0 样本量相同情况下,标准差越大标准误越大。
个体观察值的分布、变量的概率分布和统计量的抽样分布?
样本均数及其随机性
以获得的样本无随机性可言。随机分布在于抽样之前
t分布和F(1,n-1)分布的关系
t²~F(1,n-1)
第五章 参数估计和假设检验
统计描述之后,以一定概率推断总体的特征和性质称为统计推断statistical inference. 其内容包括参数估计和假设检验
第一节 参数估计
由样本信息估计总体参数称为参数估计(parameter estimation) 其还包括point estimation和interval estimation
I. 点估计
直接用样本统计量作为总体参数的估计值。
未考虑抽样误差,无法回答各抽样统计量谁更具代表性
II. 区间估计
按一定概率/可信度/confidence level:(1-α)用一个区间估计总体参数所在的范围,此范围称作可信度为1-α的可信区间/置信区间(confidence interval,CI)。 区间估计通过摸清统计量的抽样分布规律来更好的估计总体参数。
i. 总体均数的CI
公式推导
可信限
confidence limit.
CL
lower,下限/下可信限
CU
Upper,上限/上可信限。
(CL,CU)为开区间
n>100时CI公式的简化
0.05-1.960
0.10-1.645
ii. 两均数之差的区间估计
公式推导
iii. 总体率π的区间估计
正态近似法
适用条件
n(1-P)P>5
公式
直接计算概率法/确切概率法
适用条件
n(1-P)P≤5
查表获得
iv. Poisson总体平均计数μ的区间估计
Poisson分布特殊在其仅有一个参数,总体方差=总体均数μ,为与连续型资料区别,称其总体均数为总体计数。
正态近似法
直接计算概率法
样本计数X≤50时,查附表9
v. CI的两个要素
accuracy
准确性/可靠性,反映可信度1-α的大小。 可信度越接近1准确性越好,常用90、95、99%
precision
精确性指可信区间宽度。区间越窄越好 其与变量的变异度大小、样本量及可信度取值有关:个体变异越大、样本量越小,区间越宽。
准确性与精确性相互牵制
较小的α必然使区间变宽,精确性下降。 实际中常用95%兼顾两个要素。
第二节 假设检验
hypothesis test是卫统中一个极其重要的理论问题。
I. 目的与意义
i. 识别造成现有样本均数与已知总体均数之差是纯属抽样误差还是说两个总体本身就不同
ii. 并以一定概率对总体的假设做出推断
iii. 也可分辨多个样本是否分别属于多个不同总体
总之就是用于判断样本是否源于特定总体
特定二字表明这个特定的总体给了你总体参数,只需要用获得的样本统计量去推断
II. 原理与步骤
i. 建立假设
H0:hypothesis to be tested/null hypothesis
检验假设/原假设/无效假设。
H1:alternative hypothesis
备择(备选)假设,其意义在于当原假设被拒绝后采用。
二者互斥,非此即彼
示例
单样本检验:
H0:μ=μ0
H1:μ≠μ0
包含μ>μ0和μ<μ0两方面
ii. 确定检验水准
检验水准?
size/level of test. 即定义小概率事件的最大概率,拒绝H0的最大允许误差。 常用α表示,α是指拒绝了实际上成立的H0的概率 若α=0.05,即指从假设的H0总体中随机抽到当前这个样本的概率不超过5% 尼玛的什么狗屁解释。 就是说,α越大,对H0假设的容忍性越大,比如上述取值0.05时,只要最后统计量得到该概率小于5%,即推翻H0;α换0.1时,概率小于10%才可推翻H0 即容忍性越大,犯错概率也就越大
iii. 计算检验统计量
检验统计量?
test statistic.衡量样本与已知特定总体的差别或偏离程度的指标。 常用t来衡量
iv. 推断结论
对H0的判断利用了概率密度函数,这里运用了t分布。 如果H0成立,所得的统计量t的绝对值应较小,接近于0。 而当t绝对值大到一定程度,其概率已经小于α时,认为H0事件为小概率事件
做出结论
拒绝H0接受H1时,我们认为该样本和特定总体均数的差别并非偶然/随机误差(即仅仅由抽样误差造成),而是存在本质上的差别,即总体不同——二者差别是significant(非偶然
接受H0,二者差别属non-significant
第三节 假设检验的两类错误与检验效能
I. 推断结论4种情况
记住俩型概率分别为α和β
II. 假设检验两类错误
type I error
弃真,即拒绝了实际上成立的H0
α值大小在先前由研究者设定
越小其容忍误差越小,越能保证取值落在指定区间内,越精确。 但是越小意味着取值落在范围内越有把握,即CI越宽,这不利于精确性。
I型错误概率α=0.05的解释
如果H0真实成立,那么因错误判断而拒绝H0的概率为0.05,即100次抽样中平均5次出现检验统计量t>tα,ν(错误结果)从而拒绝H0的情况
type II error
存伪,没有拒绝实际上不成立的H0
β大小与样本量、α、两总体实际差距有关
β大小难以确切估计,在n确定时与α相互制约
α和β呈反相关? α越小,意味着犯I型错误概率越小,即更不可能弃真,即更有可能接受实际正确的H0。由于1-β越小,β越大,拒绝实际不正确的H0而接受H1的概率越小。
若要同时减少α和β,唯一方法为增加样本量
若重点减小α,一般取α=0.01;若重点减小β,则一般取α=0.05/0.1或更高
1-β:power of a test/检验效能/检验功效
检验效能/把握度。 是发现两总体有差异的能力。由于需要依靠样本估计总体,故样本量越大,越能代表总体,判断差异能力越大。
1-β=0.9的释义
意味着100次抽样中平均90次(概率)出现检验统计量t>tα,ν的情况。 即接受H1的概率为90%,当H0不成立,拒绝H0接受H1的概率
检验效能影响因素
1. 总体间真实差异
其他条件不变,两个总体参数之间的差异越大,功效就越大。特别要注意的是这个差异是总体均值的差异,而非样本均值的差异。 意思就是如果两个总体本来差异就明细,那你发现差异也更容易。
2. α
其他条件保持不变,显著性水平越小,功效越小
定值
3. 抽样误差
样本量
即样本量越大,样本代表总体的能力越大。通过样本来估计更可靠
增加检验效能最有效的方法即是增加样本量
个体变异
即总体标准差σ。 个体变异越小,分布越集中,受误差影响越小?
非处理因素的均衡可提高功效?
即混杂效应可降低功效
第四节 基本概念辨析
I. 可信区间含义
若α=0.05,可信度1-α=95%,则表示,若重复抽样100次,每个样本的可信区间中平均约有95个区间包含了总体参数,而有5个不包含总体参数 之所以不能理解为parameter有95%概率落在区间内,是由于总体参数虽然未知,但却是固定且唯一的,并非随机变量。
具体的一个CI,它要么包含parameter要么不包含,无概率可言。这里的概率类比电子云
样本量的增加使得CI变窄,但不影响其包含parameter的可能性
II. 正确理解α水准和P值的意义
即α代表的是检验统计量tα,ν对应的概率。 而P代表实际统计量t在分布中对应的概率。 如α=0.05,上述所说的概率均为比t绝对值更大方向上的曲线下面积 P≤α,意味着P对应面积≤α,即P对应t的绝对值比tα,ν更大,离中心更远。 书上写的什么狗屁
各自定义
α
犯I型错误的最大风险,在范围内不算错。 0.05意为有5%几率犯Ⅰ型错误
P
从H0规定的总体抽样,求得≥现有检验统计量值的概率
P值越小,同总体假设概率越低,风险越小
III. 单侧检验和双侧检验
单侧检验依据资料的性质和实验的设计来决定(依赖于专业知识
若单侧检验恰当,其效能优于双侧
若单侧检验不当,P值将偏小,增大Ⅰ型错误概率
IV. 统计推断的风险
区间估计为什么存在风险
推断包括区间估计,那么当1-α为100%时,相应可信区间为(-∞,+∞) 该CI毫无意义,类似于-它在哪儿? -它在宇宙中。 因此CI总是有限的,1-α总是小于100%,故区间估计存在风险
假设检验为何存在风险
拒绝或不拒绝H0分别会有产生I和II型错误的风险。
V. 区间估计和假设检验的联系
区间估计属于参数估计,是参数未知的情况。 而假设检验参数已知(假设已知)。 二者共同核心在于共用了同一个pivot变量(即使用了一个分布已知的变量) 多数情况下区间估计的信息大于假设检验,即前者可完全替代后者。 在总体参数的论断上等价。
第六章 研究设计概述
第一节 研究设计的基本概念
科研按是否干预分类
observational/non-experimental/comparative study
观察性/非实验性/(非随机化)对比研究。 受试对象接受的因素/暴露并非随机化决定(?)
design of investigation
调查研究设计。
experimental study
优点:更好控制偏倚
对象受干预前来自同一群体(对混杂因素的控制
随机分组更好控制选择性偏倚(组间均衡性和可比性更好
缺点:
样本量较小时无法保证混杂因素得到充分控制
design of experiment, DOE
实验设计。指研究者根据研究目的人为控制实验单位实施干预措施的研究方案。
第二节 实验设计的基本要素
三要素。科研目的就是阐明某种或某些处理因素对受试对象产生的效应。
I. subject
受试对象/研究对象:是处理因素作用的客体,是根据研究目的确定的研究总体。
根据对象不同的实验分类
animal experiment
动物实验,其受试对象为动物或生物材料。
clinical trial
临床试验,受试对象通常为患者(疫苗试验也可为正常健康人
field trial
现场试验,受试对象通常为正常人。
subject应满足的条件
对对象严格规定以保证其同质性和代表性,从而使研究结果更具普遍性和推广价值。
对treatment敏感
反映必须稳定
纳入inclusion criteria & exclusion criteria
II. treatment
处理因素:研究者根据研究目的确定施加于对象的措施,并阐明其效应。 一次实验中处理因素不应过多或过少,过多会使分组及所需受试对象数目增多,过少则难以提高实验深度和广度。
非处理因素
与处理因素并存、能使对象产生效应的因素。 其干扰实验效应及因素间规律的观察,也称为混杂因素confounder
按研究因素与水平不同分类
单因素单水平
如研究某药物对原发高血压的降压效果
单因素多水平
某药不同剂量的降糖效果。
多因素单水平
不同药物或疗法对某病的治疗效果
多因素多水平
临床上探索某肿瘤联合化疗方案。
确定处理因素时应注意
分清treatment和confounder
保持处理因素恒定不变
包括处理因素的施加方法、强度、频率和持续时间等。
III. effect
实验效应是处理因素作用于受试对象的反应response和结局outcome,其通过观察指标来体现。
观察指标的要求
客观性
主观指标
受试对象得主观感觉、记忆、陈述或实验者的主观判断结果。
客观指标
借助测量仪器和检验手段来反映的观察结果
精确性
准确度accuracy
指观察值与真值的接近程度,其大小主要受系统误差影响。
精密度precision
重复性
针对同一对象,在几乎完全相同条件下的重复观察值的误差称为指标测量的重复性。 重复性涉及指标应用价值与意义
离散性
同一人群不同对象的同一指标观察值的离散性。 离散性与样本量相关
特异度和灵敏度
特异度specificity
鉴别真阴性的能力。能力越高越不受混杂因素干扰。
灵敏度sensitivity
检出真阳性的能力。能力越高,处理因素的效应能更好反映出来。
指标的观察
观察的偏性
研究者心理倾向于阳性结果,医生偏于新疗法,受试者对新疗法怀疑。
为解决观察的偏性,设计时常用盲法blind method
单盲
盲受试者
盲医生
双盲
同时盲受试者和盲医生。均不知试验组和对照组的分组情况
第三节 实验设计的基本原则
I. control
设立对照是控制混杂因素和偏倚不可或缺的手段。
对照设立条件
满足均衡性 balance
设立对照组时除了给予的处理因素不同,其他一切因素与实验组均需一致。
同期对照 concurrent control
整个实验过程,对照与实验组都应始终处于同时同地
尽量不用 历史对照 historical control 或其他研究资料作为对照
历史对照仅适用于受混杂因素影响较小的疾病。
比较各组基线 baseline 情况
检验两组在实验开始时状态是否均衡
对照形式分类
1. placebo control
安慰剂对照。设置目的在于克服研究者、受试对象、评价者等由于心理因素所形成的偏倚。 可消除疾病的自然进程影响? 通过直接度量试验药物和安慰剂之间的不同(排除了除真正效应意外的其他干扰因素) 使用应慎重,不得损害受试对象健康
placebo
安慰剂是一种无药理作用的假药或称伪药物(dummy medication) 其外观如剂型、大小、颜色重量口味等与试验药物一致,它不含试验药物的有效成分,不能被对象所识别,主要用于盲法。
2. blank control
空白对照即对照组不接受任何处理因素,在动物实验室方法中最常用。 常用于评定测量方法准确度
空白对照可用于以下两种不适用安慰剂对照的情况
处理手段非常特殊,安慰剂盲法难以实行
例如试验组为放射治疗或外科手术
试验药的不良反应非常特殊,以至无法使研究者处于盲态blindness
这时使用安慰剂对照的意义不大,不如采用空白对照
与安慰剂对照的区别
空白对照未给予任何药物,其简单易行 但却非盲。
3. experimental control
实验对照对对照组不施加处理因素,但施加某种与处理因素有关的实验因素。 当处理因素的施加需要伴随其他因素(如赖氨酸作为处理因素添加至面包),而这些因素影响实验结果时,应该设立实验对照,以保证组间均衡。
4. self control
自身对照。对照与实验都在同一个受试个体上进行。
5. standard control
标准对照。即采用现有标准或常规方法,或者现有标准值或参考值作为对照。
II. randomization
随机化分组原则,使得每个受试对象都机会均等地被分到不同的实验组和对照组。 随机化使得组间的混杂因素分布较均匀
抽样的随机
分组的随机
实验顺序的随机
每个受试对象先后接受处理的机会相等
III. replication
重复原则。重复是指相同实验条件下进行多次研究或观察,以提高实验可靠性和科学性。
整个实验的重复
确保实验的复现性和可靠性。 不可重复的研究不具备科学性
用多个受试对象进行重复
换言之,要具有足够的样本量。
同一受试对象的重复观察
保证结果的精度。 将多次观察的平均值作为最终观察值。
第四节 常用的研究设计方案
I. 实验性研究设计
完全随机设计 completely randomized design
simple randomized design/简单随机分组设计。 采用完全随机化分组方法将同质实验单位分配到各个处理组,各组分分别接受不同处理。 直接随机分组。
分类
balanced design
平衡设计:各组样本量相等
unbalanced design
非平衡设计:各组样本量不全相等。
优点
设计简单易于实施,出现missing value时也可进行分析
缺点
样本量较小时,均衡性较差,抽样误差较大
与随机区组设计相比,有混杂因素的情况下效率会更低
随机区组设计 randomized block design
随机区组设计/随机单位设计/配伍组设计。实际上是配对设计的扩展,通常先将实验单位按需配对因素的性质相同或相近者组成区间,再分别将各区组内实验单位随机分配到各处理或对照组。 先配对区组再随机。
设计原则
组间差别越大越好,组内差别越小越好
选择与评价指标关系密切的因素作为配对因素。 并且同区组内受试对象的配对因素性质的差异越小越好(性质差异过大的话,区组之间分化会很严重,导致结论可能仅适用于小部分群体
优点
与完全随机设计相比,其区组内对象有较好同质性,减少了混杂偏倚,更易发现处理组间的差别,提高了实验效率
缺点
要求区组内实验单位数与处理数相等,结果中若有数据缺失则分析较麻烦
随机对照试验 randomized control trial, RCT
随机对照试验,指将具备纳入标准又不具备排除标准的受试对象随机分配到实验和对照组,在一致条件和环境中同步观察和研究试验效应。 RCT(随机、对照、试验)是一个类别,满足这三个元素都可算RCT。 随机分组之前对象来自同一人群,之后按是否采取干预划分为对照和实验组。RCT贯彻了随机化原则,对照和实验组之间除了实验因素不同以外,其他条件基本相同。
优点
1. 采用随机分配原则,有效避免非实验因素影响,突显实验因素
2. 增强组间可比性,使结论更靠谱
3. 更好地控制了非实验因素,减少偏倚和误差
4. 满足统计学假设检验中的:所处理的资料必须贯彻随机化原则
实验步骤
制定实验计划
确定研究对象
样本含量计算
严格进行随机分组
盲法的应用
资料收集和分析
与前俩设计的区别在于?
只要满足了随机、对照、实验三元素就是RCT。 意思是俩实验设计也属于RCT?
II. 观察性研究设计
流病内容略
cross-sectional/prevalence study
横断面研究/患病率调查
主要方式
census
sampling surveys
case-control study
cohort study
第五节 基本概念辨析
I. 实验性研究和观察性研究
II. 处理因素与非处理因素
非处理因素与处理因素相互对应并同时存在,同样能使对象产生效应,对需要研究的效应关系形成干扰。
III. 病例对照研究和队列研究
IV. 病例对照研究和患病率
病例对照的两组人数是研究者自己设定的,患与不患代表不了总体
V. 完全随机设计与随机区组设计功能差异
目的差异
完全随机设计 :控制混杂效应,将其归为随机抽样误差一部分
而抽样误差受个体变异和样本量的影响。 这里则将混杂效应归于个体变异?
随机区组设计:减少或消除混杂效应
注意
研究对象、实验条件、实验过程都控制非常好的完全随机设计,其混杂效应小至可忽略,其检验效能可能高于随机区组设计
随机区组设计不得配对过多因素,否则降低样本代表性,使其结论仅对少数个体成立
中心主题
绪论
已知在某个人群中,糖尿病的患病率为8%,则可以认为在该人群中,随机抽一个对象,其患糖尿病的概率为8%
对的。属于总体→样本
某校同一年级的 A 班和B 班用同一试卷进行一次数学测验。经过盲态改卷后,公布成 绩:A 班的平均成绩为80 分,B 班的平均成绩为81 分,请评议下列说法是否正确,为 什么? a)可以称A 班的这次考试的平均成绩低于B 班,不存在抽样误差
抽样误差为什么存在?抽样误差源于个体变异和随机抽样。 采用样本估计总体就需要考虑如此,但此题尼玛就是总体, 没有抽样就没有抽样误差。
该题总体和总体均数都需要分组说明。 idontknowwhy
对于一次随机抽样,能否认为小概率事件是不可能发生的?
小概率事件的规定就是,一次随机抽样中,可以认为不会发生的事件。
统计描述
不论数据呈何种分布,都可以用算术均数和中位数表示其平均水平。
大前提是,这是统计描述中的集中趋势描述,需要反应得到集中趋势才行 中位数:适合的是定量资料和开口资料(分类资料你没法分析,开口资料没首尾,不需要像均数那般把每个数值都算进去 均数:要想反应集中趋势,那还得是对称分布
在一组变量值中少数几个变量值比大多数变量值大几百倍,一般采用什么指标描述集中趋势?
均数不行。 中位数行,其受极值的影响小
只要单位相同,用s 和用CV 来表示两组资料的离散程度,结论是完全一样的
假象:比较一组体温和一组恒星温度——S算可以,但没有可比性 或比较一组penius长度以及balls重量,这S算可以,还是没有可比性。 这时候需要采用CV。 题中所指单位量纲相同还不够,均数差距过大也不具备可比性。
描述200 人血压的分布,应绘制频数图
正确。但觉可疑。 血压是定量资料,但是分类和定量都有频数表图描述分布
集中趋势的描述也就是平均水平的描述
越集中的地方数值之间靠得越近越多,也就是平均水平。 集中的趋势使得计算平均水平时,结果倾向于集中位置。
为了描述资料分布概况,绘制直方图时,直方图的纵轴可以为
频数、频率、频率/组距
对于同一非负样本资料,算数均数一定大于等于几何均数
几何均数适用资料
适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态/对称分布)的资料,以及等比数列资料
四分位数间距和四分位数范围?
范围是区间,间距是长度。 二者是(a,b)和|a-b|的区别 Messiah.: 噢,大概知道了。范围涵盖的信息要比间距多一些,不同资料不同范围也可能有相等间距 Messiah.: 所以四分位数范围作为指标优先级高于间距一些
常用概率分布
二项分布越接近Poisson分布时,也越接近正态分布
二项和泊松均为离散型分布,且数学上可证明当π很小且n→∞时,二项趋近于泊松分布。 而二项分布形状取决于其俩参数n和π的大小,当π=0.5时,二项以nπ为对称轴,呈对称分布;而当n较小时,π离0.5越远,分布越偏 故只要不太接近0和1,随n增大,二项趋近于正态分布。(离散型的n足够大近似为连续型分布) 故×,题中两个趋近条件不一致。
从同一新生儿总体(无限总体)中随机抽样 200 人,其中新生儿窒息人数服从二项分布
目前不明白为何不能服从泊松。 姑且理解为泊松分布判断关键是出现单位时间/空间(内发生事件次数)
在 n 趋向无穷大、总体比例π趋向于0,且nπ保持常数时的二项分布的极限分布是Poisson 分布
书上没有强调保持常数
关于Poisson相加性应用的例题
相加性原则外的乘除不影响均数
μ=40,Y=X/2则服从 正态分布/2 仅仅是正态分布的变量除以2,不能算进去
p48-2、4、5
已解决呜呜
抽样误差与分布
大样本量的非正态分布,可认为其资料变量近似服从正态分布的
中心极限定理用的是资料的“样本均数”,不是资料本身。
某研究者做了一个儿童血铅浓度的流行病学调查,共调查了 1000 人,检测了每个人血 铅浓度,计算这 1000 人的血铅平均浓度。对于现有的 1000 人的血铅浓度资料,可以认 为该资料的样本均数近似服从正态分布。
样本均数概率分布需要在抽样发生之前。 此如同量子态,观察之后为定值,观察前为概率云。 该资料已为现有资料,样本均数已经可以计算出来,为一个数值。不存在概率分布
样本均数的抽样误差定义
即样本均数与总体均数之间由于抽样所导致的差异。
样本均数抽样误差与总体标准差的关系
前者是σx。 后者σ σx=σ/√n
统计推断
1. t 检验统计量服从自由度为ν 的t 分布
这个陈述需要一个大前提。即H0成立 首先什么是t分布,它是从μ为参数的总体中抽样得到的样本的样本均数服从的分布。 所以如果一个统计量需要服从t分布,那它必须是从μ的总体中抽样。 原t分布公式中分子的Xbar和μ源于同一总体,这是大前提。 由于样本均数也服从μ的正态,故借此检验。如果该样本均数取自此总体,在允许抽样误差前提下,其样本均数Xbar与μ接近。故当t绝对值较大时,二者距离较大,可考虑否认H0
2.
后面的大于关系是指检验统计量t的位置在H0假设承受范围之外,即属于小概率事件,表明应该拒绝H0接受H1. 此时本题的意思即为:H1为真且判断准确的概率为多少? 记住α和β分别为俩型错误的概率。犯II的概率为β,那么判断正确的概率即为1-β
3.
需要知道的是α是实验之前确定的,为定值。故其与n无关,尽管n可影响β而β与α反相关。 但β取值也不能影响α
4. 可信度是个什么?
可信度也叫置信度,即confidence level,1-α α有且仅代表I型错误概率。越小犯错概率越小,置信度也就越大了,算出来的CI越宽
5.
这尼玛是用来估计Xbar的?具体见左支
6.
Messiah.: 就是那个,我们做统计推断的假设检验最后是需要下定论的。认为这俩均数等或不等 然后这道题考点可能偏向于结论文字表达,无统计学意义是指这俩样本均数的差异是由随机误差导致,不是俩样本代表的总体有本质差异 Messiah.: 所以认为样本均数有统计学意义,也就认为样本均数的差异并不单单是随机误差导致,其中存在总体层面的本质差异 A
7.
8. 假设检验中,当P>α时,虽不能拒绝H0,但不能推断H0成立,为何?
假设检验的逻辑学基础是:反证法。 什么是反证法?即假设结论成立,在推理过程中寻找疏漏倒推结论错误。 故反证法仅仅是寻找推翻结论的证据,而非支持结论的证据。 并且假设检验存在“存假”的II型错误,即便不拒绝H0,H0仍然有不成立的概率(β)。
9. Poisson的μ的区间估计
p79
研究设计
随机区组设计检验效能一定高于完全随机设计
否。 设计全方面都控制得很好得完全随机设计,其混杂效应可忽略,可吊打随机区组。 而随机区组也可存在矫枉过正,即加入太多因素配对,以致丧失代表性,检验效能降低
RCT是实验性研究
RCT,包含三元素之一:实验。(采取了干预措施) 但实验性研究不一定满足RCT,可能没有随机分组或设立对照。
随机对照试验就是完全随机设计
RCT的研究设计可以是完全随机设计,也可以是随机区组设计。 RCT贯彻了随机化原则,对照和实验组之间除了实验因素不同以外,其他条件基本相同。
采取随机分组可提高检验效能
否。 随机分组的作用是控制混杂因素。 而提高检验效能,最有效方法即是增大样本量。
队列研究所获样本资料不能估计人群中研究因素的暴露比例
注意是“人群中”,即总体暴露比。 其中选入队列的暴露和非暴露组人数为1:1,不属于随机抽样。 只有从人群中随机抽样获得的样本暴露比才可估计总体的暴露比。
实验设计的三个基本原则是什么?
随机对照重复。
?
随机化的作用是什么?
均匀分配混杂因素,使其可归于实验误差 是统计推断的前提基础
p93-4?