导图社区 《卫生统计学》第一篇 统计描述(第一章到第三章和第14到15章)
主要是介绍卫生统计的的统计描述,从数据的分布的描述开始,再到数据的来源,数据的来源还可联系十四十五章的调查研究设计和实验研究设计两种重要的数据来源方式,最后认识数据的之间的关联!
编辑于2022-08-22 15:30:13 广东社区模板帮助中心,点此进入>>
第一篇 统计描述
绪论
变量的分类
知识陷阱
定性变量(计数资料)
变量的原始取值需要用文字来描述
eg.学历、婚姻状况、就业状况
分类
有序分类变量(等级资料)
取值的各类别之间存在程度上的差别,给人以“半定量”的感觉,我们也将其称为等级变量
eg.学历、病情、疗效
无序分类变量
各个取值间没有程度的差异
eg.性别、血型
分类
二项分类变量
名义变量
虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线性回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实
例如,反映文化程度的虚拟变量可取为:1:本科学历;0:非本科学历
多项分类变量
定量变量(计量资料)
变量的原始取值是具体的数值
eg.年龄、家庭人口数
分类
连续变量
取值在理论上是连续不断地
eg.年龄
离散变量
取值范围是间断而不连续的
eg.家庭人口数
变量类型分区分还与分析的基本单位有关,例如:就患病与否的问题,若以人为基本测量单位和分析单位,他是二项分类变量,但若以地区为基本测量单位和分析单位,患病率则为定量变量
变量转换的方向性
出于某些研究目的,各种类型变量间可以进行转换,如血压值为定量变量,可按照一定临床标准,将其转换为定性变量
变量的转换通常具有方向性,只能由“细”向“粗”转化,即“定量→有序分类→二项分类”,这种转换将损失部分信息,显然不能做相反方向的转化
对定性变量进行统计学处理,往往需要对其进行编码
补充(不是重点)
变量:观测单位的某种特征或属性
变量值:变量的具体取值
数据的核心地位
数据比轶闻显然更重要
数据可能受到社会的影响
警惕潜在因素的影响
结论不是绝对的
第一章 数据分布的描述
频数分布表和直方图的编制原则和方法
认识原始数据的分布的方法
频数分布表步骤
找出最大值和最小值
排序
计算全距(R)
极差
确定组距
组距=全距/组段数
通常组段数取8~12组
确定组段的上、下限
上限:每个组段的终点
下限:每个组段的起点
第一组应包括最小值,最后一组应包括最大值
除了最后一组,每个组段都是半闭半开区间(下限值为闭区间,上限值为开区间)
列表整理
组段
频数
频率
累积频数
累积频率
直方图步骤
横轴上标出各组段
用直条的高度表示各组段的频数/频率,频数/频率越大则直条越高
两个核心问题
频数分布应该如何分组?
等距分组
非等距分组
看图时警惕!
往往不具有可比性
分多少组?
组段数太少过于笼统,会掩盖数据分布的规律
组段数过多,会使每个组段的频数都很少,失去了制作频数分布表和直方图的意义
数据的分布特征
分布形态
考虑
是否对称
偏离的方向
分类
对称分布
偏态分布
右偏态、正偏态:有小部分数据偏大,直方图呈现右侧拖尾(即越大越矮)
常见:大多数重金属和微量元素在体内含量,个人经济收入(经对数转换,往往呈对称分布)
左偏态、负偏态:有小部分数据偏小,直方图呈现左侧拖尾(即越小越矮)
常见:冠心病患者的年龄分布
集中趋势和离散趋势的描述
集中趋势:指一组数据向某一中心值靠拢的趋势,反映了一组数据中心点的位置,是频数分布表和直方图中高峰所在位置,即频数最大的组段
离散趋势:部分数据偏离中心位置,从各个组段的频数分布可以大致了解观测值偏离中心的程度
集中位置的描述指标,以及各自的适用条件
位置测量指标(可以理解为等差、等比、等秩数列对应的中间值)
均数
算术均数
定义:一个变量所有观测值的和除以观测值的个数
计算
可测得的每个个体观测值
x(均数)=1/n *Σxi(n,i=1)
只有汇总的频数分布表数据(可求近似值)
(频数×对应组段的组中值之和)÷观测值个数
反映一个变量所有观测值的平均水平
适用条件
描述不含极端值的对称分布变量的平均水平,这时均数位于分布的中心位置
几何均数(G)
几何均数就是算术均数在对数(指数)层面的体现形式,因此算术均数具有的性质,几何均数也会有对应的体现
定义
所有n个观测值乘积的n次方根
计算
可测得的每个个体观测值
可先求G的倒数,再求G
只有汇总的频数分布表数据(可求近似值)
用组中值估计对应组段各个观测值的大小
适用条件
观测值>0
存在少数偏大的极端值的正偏态分布的数据但对数转换后呈近似对称分布
观测值之间呈倍数关系或近似倍数关系的数据
eg.抗体滴度、血清凝集效价等
中位数(M)
定义
是一组数据中居中位于正中位置的数
第50百分位数(P50)
计算
将所有观测值从小到大顺序排列,中位数将数据一分为二,所有数据中有一半数据比它大,一半数据比它小
n为奇数时,最中间那个数
n为偶数时,最中间的两个观测值的均数
缺点
与均数比
没有考虑大部分观测值的实际大小,均数充分利用了全部数据
两组数据合并时,合并后的中位数不能用原来两组的的中位数表达,而均数可以
均数可通过如估计截尾均数等方法进行修正,而中位数无法进行这样的修正
见第五节
均数更常用于较为复杂的统计分析
优点
不易受两端极端值的影响
适用条件
对称分布和偏态分布数据平均水平的描述
当数据中有极端值、不确定值、数据呈偏态分布或分布形式未知时
百分位数(Px)
是指将所有n个观测值从小到大顺序排列后,对应于x%位的数值
计算
实际情况中,往往找不到一个值正好有x%≤它
可先排序,计算n✖️x%=j
若j=整数,则Px=第j个和第j+n个观测值的平均值
若j≠整数,则Px=往后取与j毗邻的整数位上的观测值
频数分布表
百分位数所在组段的下限+下限到百分位所在的一点点
变异程度的描述指标,以及各自的适用条件
变异:个体值之间的差异 离散度测量指标
极差(R)
定义:全距,所有观测值中最大值和最小值的差值
反映
一组数据的整个变化范围
越大说明变异程度越大,数据越离散
适用条件
传染病、食物中毒的最短和最长潜伏期等
样本例数较少时
局限
仅用到最大值和最小值的信息,不能反映组内其他数据的变异情况
极差与样本例数有关,样本量相差较大时,不宜用极差进行比较
四分位数间距(IQR)
定义:位于中间一半数据的极差。
不受两端极大或极小数据的影响,四分位数间距比极差更为稳定
计算
第25和第75百分位数之差
适用
两端的极值不稳定导致极差的结果不够可靠时
实际应用中,四分位数间距和中位数一起使用,综合反映数据的平均水平和变异程度,写成M(P25,P75)
基于百分位数间距
方差与标准差
方差(s2)
定义:所有观测值的离均差平方和的平均值
描述所有观测值与均数的平均偏离程度
计算
方差的分母常常采用(n-1)而不是n
第五章有解释
总体方差的无偏估计
与自由度有关
在n较大时,两种方法的计算结果相似
意义:方差越大说明数据越离散,变异程度越大
标准差(SD)
定义:方差的平方根
标准差的单位与原始观测值的单位一致,更多使用标准差而非方差来反映数据的离散程度
局限
标准差比均数更容易受到离群值的影响,个别离群值就能使它明显增大
适用
一般与均数相结合使用,描述不含离群值的对称分布的分布特征
变异系数(CV)
定义:是一个度量相对离散程度的指标,是变异大小(s)相对于其平均水平(x-)的百分比
计算
CV=(s/x)×100%
意义:无单位的相对指标,变异系数越大,表示变量的变异程度越大
适用
了解单位相同但均数相差悬殊的变量之间的变异程度
比较几个不同单位的变量的变异程度
eg 成年男性体重的标准差在数值上低于0~3岁婴幼儿体重的变异,但由常识可知其情况恰恰相反,造成这种相反情况的原因在于成年男性的体重级远大于婴幼儿。
基于均数和方差
描述数据分布的指标
箱式图与箱式百分位数图
用适当的图形来呈现描述数据的 集中位置和变异程度的统计指标
箱式图/箱线图
信息包括:最小值、下四分位数、中位数、上四分位数、最大值
都是从小到大排列后的位置数
箱体高度表是四分位数间距,越高,变异程度越大
对于偏态分布数据,中位数左右两边数据的离散程度不一样,用四分位数间距这一指标总结整个数据的离散程度有失全面,可通过比较Q1和Q3偏离中位数的情况了解数据的偏度
1⃣️中位数的横线在箱体的中间位置则表示数据呈对称分布、 2⃣️中位数横线靠下端则提示右偏态 3⃣️中位数横线靠上端则提示左偏态
适用
探索性分析常用的图形工具
简洁地呈现数据平均水平和变异程度的一系列关键指标值
实际应用中往往将几组数据的箱式图绘在一起,便于组间的比较
改进的箱式图
加入了均数和离群值
竖线最下端和最上端表示的是排除了极端值和离群值以外的其他所有观测值中的最大值和最小值
箱式百分位数图
结合箱式图和直方图
制作
通过原始数据确定图形纵坐标的位置,再将n个观测值从小到大排列
假设中位数的宽度为w,则将数据从小到大排列后第k个观测值所在位置的箱体的宽度为:k=[w/(n+1)]×k(xk<M),(n+1-k)×k=[w/(n+1)](xk>M)
箱式图对离群值进行了定义,并对这些离群的个体值单独描点,而箱式百分位数图并没有特别标出离群值
基本思想:根据数据百分位数信息,对箱体的宽度赋予权重,其中箱体中间位置权重大,箱体最宽,越往两端权重减小,箱体变窄
特点
若箱式百分位数图关于中位数上下对称则提示资料呈对称分布
箱式图对离群点进行了定义,并对这些离群的个体值单独描点,箱式百分位数图并没有特别标出离群值,但可以从图上直观判断(对应上下延出的一条又长又细的线)
箱式百分位数图对所有数据进行了描述
离群值定义及判定方法
运用统计方法发现其他一些异常值
定义:一组数据中如果个别观测值与其他数据相比差异较大,远远偏离大多数数据的平均水平,这样的观测值称为离群值
判定方法
通过频数分布表或直方图初步判断
连续几个组段的频数均为0,之后出现特别大或特别小的数据
利用箱式图判断
离群值:距离箱式图底线或顶线为箱体高度的1.5倍以上
极端离群值:超过3倍以上箱体高度
可疑离群值:1~1.5倍箱体高度
当数据近似正态分布且样本量较大(n>50),也可用x±3s判断离群值
通过统计检验判断
检验偏离程度是否超出随机误差所能解释的上限
方法:Nair检验法(已知标准差时),Grubbs检验法、Dixon检验法和峰度-偏度检验法(未知标准差时)
结合其他变量信息判断
一些自然规律或检测标准
处理方法
不能简单地剔除,需要结合专业知识和统计学方法,设法了解造成偏离的原因
因测量或记录出现错误,或存在明显的逻辑问题,可剔除
无明确理由剔除离群值,则在剔除前后各做一次分析,分析结果矛盾时,谨慎下结论
采用一些稳健分析
截尾均数:将数据按从小到大顺序排列后,两端截掉一定比例的数据后计算余下数据的均数
分类变量的常用统计图
常见的分类变量统计指标及卫生统计其他常见指标详见十六章
饼图
定义:圆图,是将圆形分割成若干个扇形,扇形面积的大小表示同一事物内部各部分的构成比
适用
描述分类变量的构成比,说明事物内部各组成部分所占比重
绘制
各扇形通常从时钟12点处开始,按大小或自然顺序顺时针方向排列
简要著名各扇形所代表的类别和百分比
条图和百分条图
条图
定义:用直条的高度反映分类数据中每一类的频数或频率
分类
单式条图
复式条图
注意:绘制时纵轴必须从0开始且等距,否则相对比例会发生改变,有夸大差异的之嫌
百分条图
将多组数据放在一起比较其构成比
热图
定义:用不同的颜色(或者深浅)表示观测值的大小
适用
表示疾病的时间与空间分布
生物学信息中描述基因表达谱
补充(不是重点)
逻辑核查
关乎数据质量,可以发现一些异常值
检查变量类型和性质
类型
数值型变量
数字、小数点、负号
字符型变量
核查变量值范围
变量的大致范围我们视线是知晓的
有效值检查
检查观测值是否为视线定义的数值之一
一致性检查
有无前后矛盾,相关问题的逻辑是否一致
唯一性检查
每个观察单位都有一个唯一的标识号
完整性检查
检查每一个观测单位的完整性和这个数据库的完整性
交叉检查
不同来源的两个数据库中同一内容的信息应该一致
第二章 数据关联的探索
散点图的解释与用途
定性,散点图的直观感受关联性的强弱有时并不可靠,受坐标轴的设置的影响
定义:利用平面坐标显示两个定量变量之间的关系,散点图中的点与数据中观测单位一一对应
评价散点图
观察其总体趋势和明显偏离该趋势的观测单位
eg.线性趋势
为明确这种关系,可以拟合一条直线来反映这种趋势(在回归现象中会介绍)
通过散点图的总体趋势来呈现关联的形式、方向和密切程度
正向关联
负向关联
一般而言,两变量之间关系的强度是通过散点图中数据点靠近直线趋势的程度来反映
相关系数的计算及解释
定量的数值指标刻画关联性的强度与指标
相关:如果x和y具有某种共同的变化趋势,则称两个变量存在相关
最常见:直线相关
直线相关系数
两个定量变量
Pearson直线相关系数(r)
构建
方向:(xi-x-)(yi-y-)的符号来反映正/负相关关系
强度
两变量距离其中心位置越远,则乘积越大,表示强度越大
计算时需要消除量纲的影响,采用除以s(标准差)的形式去除
为了刻画整体趋势,进行求和并平均【÷(n-1)】
解释
用于衡量两个定量变量之间线性关系的方向和密切程度
方向
r为正表明正相关,r为负表明负相关
强度
取值在[-1,1]
r越接近0线性关系弱
r越接近1或-1,关系的密切程度增高
只有散点图中所有点恰好落在一条直线上时,才会出现极端值1或-1
注意
两变量均为定量变量
只衡量两个变量之间线性关系的方向和密切程度,而不能描述其他情形的关系,如曲线
r本身没有单位,只是一个数值
与均数一样,受离群点的影响,当出现离群点时,应慎用相关
给出相关系数时,还应给出两个变量的均数和标准差
秩相关系数
有一个变量为等级变量或 无法用均数和标准差描述其分布时
Spearman秩相关系数(rs)
等级相关系数
构建
等级变量中仍然有顺序信息,保留其大小次序的信息,仍利用直线相关系数的计算公式进行运算,只是计算基于原始数据的次序信息、
秩、秩次:将数据从小到大进行统一排序,排序的结果成为秩
详细可见秩和检验章节
相持:排序时,出现数据相等从而造成秩次相同的现象,此时则计算平均秩次为其秩次
含义
与直线相关系数完全相同,主要用来描述存在等级变量或者无法用均数和标准差描述其分布特征时两个变量间关联的程度与方向
相关分析都没有区分反应变量与解释变量,但其不排斥将两个变量认定为反应变量与解释变量,可根据专业知识和常识判断
最小二乘法思想
一些概念
反应变量(结局变量):研究结局的测量
解释变量:解释或者引起反应变量改变的变量
取决于对问题本身的认知以及研究目的
回归直线:描述反应变量y如何随解释变量x改变而改变的直线,常用于预测一个给定x值条件下的y值大小
回归方程:刻画回归曲线的方程。拟合的回归方程能简洁地描述反应变量y对解释变量x的数量依存关系,这种数值化概括时对散点图的定量补充
最小二乘法
目的:得到一条回归线使拟合直线与数据点的差距的平方和最小,即尽可能靠近所有点的直线
b1=r*(sy/sx),b0=(y-)-b1(x-)
b1是有量纲的值
最小二乘法是最常用的拟合回归直线的方法
注意
相关系数与斜率有密切关系,斜率表示回归直线上x每改变1个标准差,对应的y就会改变r个标准差。
最小二乘法是以b1=r*(sy/sx)为斜率通过((x-),(y-))的直线,我们可以基于最基本的描述统计量(x-)、sx、(y-)、sy、r来计算回归方程
在回归中解释变量和反应变量的区分是十分重要的
因为在运用最小二乘法思想求回归系数时,我们只关注y方向上的点到直线的纵向距离
回归方程的解释及残差、残差图
斜率与截距
斜率b1是y随解释变量x改变的改变量,是定量描述两变量间关系的重要数值指标
当改变变量的单位时相关系数不会改变,但最小二乘法回归直线方程会随之改变
最小二乘法回归直线的斜率和结局与测量值的单位有关,不能仅凭它们的大小判断其影响大小
回归系数也是有单位的值,他的单位时y/x
回归直线概括了整体趋势,给出的预测值也是对整体趋势的一个预测,并不一定完全准确
残差
定义:变量的观测值与基于回归直线的预测值之间的差异,即残差=观测值-预测值
误差:是观测值与真实值的偏离
残差:是观测值与拟合值的偏离
残差图
定义:是残差相对于解释变量或反应变量预测值的散点图
可以帮助我们评价回归直线与散点的接近程度
如果回归直线能够完全拟合数据,则残差应为0
直线与散点的接近程度较好的残差图应呈现为一条无规律且集中于0 的水平带
残差不均匀分布于0水平线附近,说明回归直线拟合效果不好,即不适合拟合该数据
回归直线拟合效果评价
定性、直观感受
相关与回归的关系
相关系数用于刻画两个定量变量间的直线关系的方向和强度,不需要区分反应变量与解释变量
在进行回归分析之前,首先确定两个变量之间存在一定的相关性(无相关,不回归)
当研究更关注两个变量之间的依存关系时,此时两个变量不再对等,有了反应变量和解释变量之分
举例:肥胖和心理健康关系的研究
相关:用于了解肥胖与心理健康之间的关联情况
回归:用于根据现有肥胖数据预测心理健康水平,解释肥胖对心理健康的影响
决定系数与相关
决定系数:在反应变量y的总变异中,r^2表示用y和x的最小二乘法回归关系所能解释的比例
作用
其大小能还能衡量相关关系的强度
可以反映回归拟合的实际效果
定量
计算:r^2=预测值的方差/观测值的方差(可用回归方程计算出预测值,然后再计算预测值的方差)
解释:在反应变量的变异中,有r^2的变异可以用y与x的直线关系来解释
Pearson列联系数
两变量均为分类变量
概念
联合分布:两个分类变量的所有单元格的构成比组成了这两个分类变量的联合分布
边缘分布:交叉表中单个变量的分布
条件分布:在设定一个变量取值的条件下,计算另一个变量取值的分布,所得到的分布就是条件分布
交叉表(列联表)的制作
一般将解释变量作为列变量,反应变量作为行变量
计算:r=根号(卡方/(卡方+n))
取值范围:[0,1)
右边是开区间!
分类变量相关分析的陷阱
潜在影响变量
辛普森悖论
补充
数据关联的含义
是否存在关联
什么关联方向
关联强度有多大
用相关及其对应的数值指标去定量反映和刻画两者的关系
一个变量对另一个变量的影响程度
采用回归刻画两个变量之间的数量依存关系
是否受其他因素的影响
下结论须谨慎
逻辑
含义:两组或多组数据之间存在的某种联系
举例
两个变量:学习成绩、学习努力程度
第一阶段:两者是否有关联,什么关联方向,关联强度有多大。(相关系数:正负、大小)
第二阶段:学习努力能在多大程度上提高学习成绩(回归:反应变量与解释变量,直线回归方程)
第三阶段:其他因素的干扰,如学校教学质量,老师教学风格(关联与因果:不同关联模式)
相关与回归的陷阱
离群点与强影响点
离群点:是指处于其他观测值总体趋势以外的观测值。离群点需区分方向,可能存在x方向的离群点或y方向的离群点。x方向的离群点未必在y方向上有很大的回归残差
与斜率大小有关
因为最小二乘法回归只关注y方向上点到直线的纵向距离,变量x和y在回归中的作用不同
因为我们预测的是y,所以我们更关心y方向上的残差
强影响点:是指会对统计计算造成较大影响的观测值,如果将其剔除,会使计算结果明显变化
影响拟合直线的斜率
若想评价一个可疑观察点对回归直线的影响,可在包含该可疑观察点和去除此可疑观察点,这两种情况下做回归分析
评价
在x方向上的离群点更容易对回归直线造成影响
在y方向上的离群点对直线的影响大小取决于其他数据点在构建直线关系时的影响强弱
是否为强影响点,仍需要从统计计算结果来看
观测值范围
影响相关关系的强度
eg选取某小学同一年级的学生/选取某小学一到六年级的学生,建立回归方程预测年龄与身高,哪个更可靠?
外推预测受到限制
外推:利用现有的解释变量x值获得的回归直线,来预测哪些超出现有的解释变量x值范围的反应变量y值的情况
不能保证超出数据范围的数值,变量间是否具有同样的线性关系
变量的取值范围变异太小会影响到两个变量的关联(主要是x 的变异范围)
非线性关联
数据转换:对于非线性关联的数据,可以采用数据转换将非线性数据转换后得到线性关联,从而使回归方程的关系更趋近线性,以便利用线性回归的方法进行分析
对数转换分析
应用于变量值均为正,但变异呈指数级变化的数据
注意在解释结果时,应在转化后的数据尺度下进行
可以直接拟合曲线
潜在影响变量
变量间的关联性在不同情形下表现可能不一致,如笼统分析时发现存在关联或无关联,此时以第三个变量进行分层分析时,再分析原来两个变量的关系,可能会出现另一种情形,即原有的关联会在某些层内发生变化甚至方向相反
有时我们面临的第三个变量可能不是一个分类变量,而是一个定量变量,此时我们可以采用将定量变量转化为分类变量,如高中低等情况。
平均数的相关
基于大量个体平均值的相关强度通常要高于基于相同变量的个体数据之间的相关强度
如绘制区县级的某年龄段儿童平均身高与年龄(以月份为单位)之间的关系,会看到二者呈正相关,且r接近于1。但年龄相同的儿童的身高存在很大的差异,儿童个体身高于年龄的关系图会显得更加分散,而且相关系数也会更小。
观测单位:平均值vs个体值
注意:根据实际问题即研究目的明确变量和观测单位十分重要
关联与因果
常见的关联模式
因果
最好的也是最有说服力的方法就是实验
共变
观察到的变量x和变脸y的关联实际上是由另一个影响变量z引起的,即使这两个变量没有直接的因果关系,共同的影响变量z也会让变量x和变量y存在一定的共变关系
eg.由于夏季高温,造成乙脑发病率与冷饮销量同时上升从而呈较强的正向关联
混杂
本章逻辑
第一章(数据分布)
单个变量的描述
定量变量
初步描述:频数分布表、直方图
定量描述:集中位置、变异程度、箱式图
分类变量
三类统计图
第二章(数据关联
两个或多个变量的描述
定量变量
初步描述:散点图
定量描述
相关系数
定量变量:直线相关系数
等级变量:秩相关系数
相关与回归的陷阱
回归直线
分类变量
Pearson列联系数
条件分布
描述两分类变量的关联情况
分类变量相关分析的陷阱
第三章 数据的产生
随机对照实验设计原则
设计原则
对照
首要原则
目的:设置对照组以减少非处理因素对处理因素效应的影响
安慰剂效应:在医学研究中患者由于心理效应所产生的虚假现象
安慰剂也可看成是某种“处理”,比如给予外表为药物的糖果进行治疗也会使患者感觉有效。人们会对受到关注的或自认为有帮助的处理出于心理作用作出反应
标准的对照试验:将试验对象随机分配到试验组和对照组,除了对试验组给予处理措施外,两组患者在其他方面都应被同等对待
随机化
通常情况
研究者按照某些条件对研究对象进行匹配后再随机分配到各组
匹配可能对试验有所帮助,但不一定能完全避免偏倚
1、有太多潜在的变量可能影响试验的结果,我们很难把所有的因素都进行匹配
2、一些重要的变量无法测量
3、研究者可能会在不知不觉中根据患者的基本信息作出违背随机话原则的行为
统计学的处理方法
每个试验对象被配分到各处理组中的机会与试验对象的特征无关,并不以研究者的意志为转移
最简单的方法:保证每一个试验对象有相同的机会进入任一处理组
随机化
保证每一个试验对象有相同的机会进入任一处理组
随机化构建除处理因素外各方面都相似的两组对象,从而反映实验组与对照组的差异来源于处理因素
两组试验对象的试验效应应归因于处理因素或某类试验对象被分配到两组的机会
重复
主要指对多个实验对象进行处理以减少实验的随机变异
潜在问题
安慰剂效应
研究者存在对处理因素的主观看法而造成实验结论的偏倚
如果研究者知道试验对象的组别是试验组或对照组,如结局指标具有主观性,则研究者在判定结果时就有可能掺杂自己的主观感受。→解决:盲法(试验对象甚至研究者均不知道试验对象接受哪一种处理,从而避免了由研究者和试验对象的主观意识造成的偏倚)
简单随机抽样
总体
根据研究目的确定的同质研究个体的全体
样本
是为了了解总体而观测的总体的一部分
简单随机样本
从总体中以相同机会抽取的n个个体称为一个简单随机样本,n为样本量
降低选择偏倚——相当于试验研究中的随机化
如果不采用简单随机抽样,得到的样本可能不具有代表性
潜在的问题
涵盖不全
总体列表难以获得
志愿者应答样本
总体中的更有意愿完成调查的部分对象组成的样本
有极端意见的对象更有医院进行回应,因此不是总体的一个具有代表性的样本
应答偏倚
当问题涉及与法律、伦理道德有关的敏感话题时,被访者可能撒谎、
即使样本代表性很好也会由于测量可能存在的缺陷得到有问题的数据
回忆偏倚
参数与统计量的概念及其关系
统计推断
从样本数据推理而得到关于总体的结论
基本想法:用样本得到的结论来“猜测”总体的真相
参数
用于刻画总体的数值特征,如总体的均数、总体中位数、总体标准差、总体率等。参数被看成总体某种特征的固定数值,通常参数的确切值未知、
统计量
用于描述样本的数值特征,如样本均数、样本中位数、样本标准差、样本率等。当获得一个样本后就可以得到统计量的值,可用于估计未知参数的值。统计量随样本改变而改变
关系
当用统计量来估计总体参数时,统计量会随着抽样结果的不同而不同,该现象可能影响我们采用统计量来估计总体参数的质量
由抽样引起的统计量与统计量之间或者统计量与总体阐述之间的变化具有某种潜在的模式,本章将定性回答这个问题。
在第五章中运用第四章知识定量回答这个问题
抽样分布与总体分布
统计量抽样分布
统计量的分布规律,描述了从同一总体重复抽样时,统计量会有些什么样的值,以及每个值出现的可能性大小
样本均数的离散程度远小于个体观测值的离散程度,样本均数的变异程度小于个体观测值
重复抽样过程
从总体中进行简单随机抽样,每次抽取的样本量为n
计算出统计量(样本均数x-或者样本率p)
重复上述两步
展示多个统计量(样本均数x-或者样本率p)的分布特征
总体分布
总体中所有个体观测值的分布
抽样误差与偏倚
抽样误差
统计量的值在重复随机抽样的样本中各不相同,这种统计量随着样本的变化而变化的现象称为抽样变异
抽样分布
从同一总体抽取样本量相同的样本,这些统计量的值构成的分布
标准误
统计量的标准差,反映了由抽样引起的统计量于总体参数之间或统计量取值之间的差异,定量刻画了抽样误差的大小
用样本均数估计总体均数时,可以借助均数的标准误的大小来帮助判断估计的可靠性
来自随机样本的统计量,其变异大小不依赖于总体的大小
统计量的变异由样本量控制,从上亿个成年人中抽取样本量为2500的简单随机样本和从上百万个成年人中抽取同样大小的样本得到的结果的可靠性是近似的
简单随机抽样等方法可以降低偏倚→样本具有代表性
但不能消除偏倚
样本量越大→统计量的变异就越小
偏倚
抽样分布的均值与待估计参数的差值称为统计量的偏倚,当偏倚为零时,则称该统计量时相应参数的无偏估计。
偏倚关注的是抽样分布的集中位置
如果研究结果与真是结果之间存在方向性的偏离,那么就存在偏倚,样本不具备代表性
偏倚与变异的箭靶示意图
高偏倚,低变异
低偏倚,低变异
高偏倚,高变异
低偏倚,高变异
补充
数据的质量
测量导致的数据
真实性
可靠性
统计推断时样本的
代表性
可靠性
明确的研究目的和严谨的设计是数据质量的基本保障
抽样调查和实验研究是最常见的两种统计设计和数据收集方式
数据的来源
轶闻数据
通常指由杂志、报纸、电视、互联网或其他媒体报道的一些个案数据,由于其特殊往往给公众留下突出和深刻的印象
缺点
缺乏代表性,往往诱导人们进行简单的推论,得到一些具有倾向性的结论
优点
有时可以给我们提高线索,为下一步研究确定、选择研究方法等提供参考
可得数据
是指为了某些特定目的的已收集或累积的数据
来源
各类监测数据
医院临床病案数据
各类统计年检
公共数据库
普查
特点
免费或以非常低廉的价格获取
缺点
通常难以完全满足某些特定的研究目的
抽样调查数据
抽样调查
通过选择和测量来自总体的样本来收集数据
基本思想:对总体中的一部分,即样本进行了解进而得到总体的信息
观察性研究
客观地观察、记录和描述事物或现象的认识活动,其显著特征是对于处于自然状态下的事物或现象进行观察
特点
观察者对被观察事物或现象在不进行任何干预的情况下所作的观察
规避道德风险
局限
每个观察对象所处的状态(吸烟与否)无法由研究者决定
两者的关联可能来源于其他混杂因素
实验研究数据
实验性研究
特点
研究对象所处的状态是由研究者决定的
干预措施:研究者决定研究对象状态的过程
可比性更好、因果关系的推断更具说服力
局限
存在伦理问题
随机对照试验
伦理问题
基本的数据伦理
知情同意
数据保密性
伦理委员会审查
联系
1、第三章回答“为什么做”的问题
2、第十四章、第十五章回到“怎么做”的问题
第十四章 调查研究设计
概述
统计工作的步骤
统计设计:是开展研究工作的前提和依据,一个完整的设计应包括研究全过程的内容
收集资料:按照设计要求取得准确、可靠的原始数据
资料整理:将搜集到的原始资料系统化、条理化,便于进一步计算与分析
分析资料与结果解释:根据研究设计的要求、资料的类型和分布的特征选择统计分析方法,包括统计描述和统计推断。最后结合卫生统计学知识与专业知识对分析结果作出恰当的解释
概率抽样及其产生的数据是进行统计推断的基础
基本的概率抽样方法及其优缺点
概述
概率抽样:按照某种特定的机会抽取样本的方法
抽样目的:在保证样本对总体具有良好代表性的前提下,利用样本信息以一定的可靠度对未知总体参数作出估计
样本量估计
样本量估计是抽样设计的重要部分
样本量不足,则抽样误差较大,抽样结果的可靠性较差,在统计推断时,检验效能偏低,总体中本来存在的差异难以被检测出来,导致假阴性结果
样本量过大,导致人力物力和时间的浪费,也可能引入其他一些偏倚
在调查研究设计中,需根据设计类型、抽样方法及结局变量的性质,借助适当的公式进行样本量的估计
在阅读专业文献时,对于那些统计推断的阴性结果,有必要复核样本量和检验效能是否偏低,以便正确评价研究结论
简单随机抽样及其样本量估计
基本概念
定义:=单纯随机抽样,最简单、最基本的抽样方法,从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个构成一组样本,总体中每个对象被抽到的概率相等(n/N)
保证总体中的每一个个体都有同等的机会被抽出来作为样本的抽样方法
优点
简单直观、均数(或率)及其标准误的计算简便
缺点
总体较大时,难以对总体中的个体一一进行编号,且抽到的样本分散,不易组织调查
适用范围
是其他抽样方法的基础,主要用于总体不大的情形
样本量估计
总体中个体的变异程度
个体间变异程度小,样本量就少,变异程度大,样本量就多
通常用变异系数CV来反
调查的精度
用最大相对误差ε反映硬度的要求
ε=测量值与真实值之间差与真实值的比值
精度要求越高(数值越小),所需样本量就越大
置信水平
通常用置信水平1-α反映置信水平
置信水平越高,所需样本量越大
通常取90%、95%、99%
系统抽样
=机械抽样
基本概念
是按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。
最简单和最常用的是:等距抽样
优点
易于理解,简单易行
容易得到一个在只能个体中分布均匀的样本
可得到按比例分配的样本
缺点
当总体的观察个体按顺序有周期性或单调增减趋势时,可能产生偏倚
抽到的样本较分散,不易组织调查
适用范围
主要用于按抽样顺序个体随机分布的情形
抽样误差可按简单随机抽样方法计算
样本量估计
由于系统抽样无专门的标准误计算公式,往往按简单随机抽样的方法来估计样本量
分层抽样
基本概念
先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本
可以综合分析,每一层也可以独立分析
分类
非等比例分配
各层抽取数量相同的个体组成样本
等比例分配
各层中抽取的比例与该层在总体中所占的比例相同
这样抽取的样本是总体的缩影,各层的结构与总体相同
最优分配分层随机抽样
既考虑比例,又考虑其变异情况
减少抽样误差
优点
样本具有较好的代表性,抽样误差较小
各层可根据调查对象的特征,采取不同的抽样方法以及资料收集方式
统计分析内容更丰富,可以对不同层进行独立分析,还可以比较不同层间的差异
缺点
若分层变量选择不当,层内变异较大,层间变异较小,则分层抽样失去意义
层内的变异越小越好,层间的变异越大越好
适用范围
主要用于层间差异较大的情形
样本量估计
类似简单随机抽样,总的样本量用简单随机抽样的公式,然后再按权重分配
总体变异程度CV的估计
即每一层的变异都考虑:每一层的变异的方差之和的标准差/每一层的均数之和
总体率的估计值p
以各层的观察单位数占总观察单位数的比重作为权数,预调查粗率估计
相对误差ε
置信水平1-α
整群抽样
基本概念
是以“群”为基本单位的抽样方法。先将总体分成若干个群,从中随机抽取一些群,被抽中群内的全部个体组成调查的样本
如果各群内部的个体数相等,抽样误差的估计则较准确
但现实很难,比如较小的两个自然村可以合并为一个“群”
群间差异差异小,抽取的群多,则抽样误差较小
优点
便于组织调查,节约成本,容易控制调查质量
缺点
样本量一定时,抽样误差一般大于简单随机抽样
因样本为广泛散布于总体中
适用范围
主要用于群间差异较小的情形
样本量估计
整群抽样抽多少群,主要与数据的S^2有关,其主要取决于个群的频率(或均数)与总体率(或均数)的差。群数与Ni/-N有直接关系,因此每个群个体数不宜太大
影响因素
在总体方差的估计值S^2
可以借助既往资料或通过小规模调查获取
相对误差ε
置信水平1-α
多阶段抽样
基本概念
将整个抽样过程分成若干个阶段进行,在初级抽样单位中抽取二级抽样单位,又在二级抽样单位中抽取三级抽样单位等
将抽样过程分阶段进行,每个阶段使用的抽样方法不同,结合使用前述方法,常用于大型流行病学调查
概率比例抽样
其中的群被选中的概率并不相等,而是与其规模大小成比例
虽然就单位规模对概率的影响来说,概率比例抽样方法是一种不等概率抽样,但由于单位规模较大被抽取的概率较大,在单位内部抽取样本时,概率较小。单位规模较小被抽取的概率较小,在单位内部抽取样本时,概率较大。两者抵消,概率比例抽样方法仍然是等概率抽样
优点
即使调查总体的规模大、范围广,也可以高效地抽取样本
在进行现场调查时,调查区域不会过于分散
克服多阶段整群抽样的缺点,既不需要根据群的大小分层,又能较好地控制由于群大大小不同而造成的偏倚
缺点
精度相对较低
样本量估计
设计效应(Deff)
单独按照上述各类方法估算地样本量一般偏小,需要进行相应地调查
几种基本概率抽样方法的对比
抽样误差:分层抽样<系统抽样<简单随机抽样<整群抽样
非概率抽样方法的类型
概述
非概率抽样不考虑随机抽样中的等概率原则,而是主要依据研究者的主观意愿、经验或方便程度等条件来抽取调查对象,因此在应用时需要研究人员具备深厚的专业背景知识与相关经验
受到重视的原因
严格的概率抽样几乎无法进行
如果调查目的仅是为了解问题的初步探索,或是为了获取进一步研究的线索,或是提出初步研究假设,此时不需由样本推论总体
总体各单位间离散程度不大,如果研究人员具有丰富的抽样调查经验,此时即便时非概率抽样,仍然可以依据经验进行判断或推论
偶遇抽样
=便利抽样
是指研究者根据现实情况而采取最便利的方法来选取样本,可以抽取偶然遇到的人或是选择那些距离最近、最容易找到的人作为调查对象
缺点
不能保证总体中每个个体都有同等的机会被遇上,代表性不好
抽样便宜大
优点
简单易行,能够及时取得所需的信息数据
节约成本
当总体各单位之间差异不大时,这种方法抽取的样本具有较好的代表性
如判定一个湖泊是否已被污染
适用条件
为非正式的探索性研究提供数据源
目的抽样
=判断抽样
时研究者根据研究目的和对情况的主观判断来选择和确定调查对象的方法,是“有目的”地去选择对总体具有代表性地样本
缺点
样本的选取具有主观性,估计精度严重依赖于研究人员的自身素质,样本的代表性受到质疑,一般不用于对总体进行数量方面的推断
优点
当研究人员具有较强的分析判断能力,且对研究的总体情况比较熟悉的时候,采用目的抽样的方法不仅方便也较为有效
适用范围
前提是调查人员对总体的有关特征由相当程度的了解
常用于无法确定总体边界或者总体规模较小、调查所涉及的范围较窄,或因调查时间、人力、费用等条件有限而难以进行大规模抽样的情况
滚雪球抽样
=链式抽样、网络抽样
当无法了解总体情况时,可以从能找到的少数个体入手,对他们进行调查,并请他们介绍其他符合条件的人,扩大调查面,如此重复下去直至达到所需的样本量
优点
可以找到越来越多具有相同性质的成员
便于针对性地选取样本而不至于“大海捞针”
缺点
对起始样本的依赖程度较高
适用范围
前提是各单位之间具有一定的联系
通常用于因稀少而难于发现者构成的总体的研究
定额抽样
=配额抽样
是按照总体地某种特征(如年龄、性别、社会阶段等)进行分层(组),然后在每一层(组)中按实现规定地的比例或数量(即定额)用便利抽样或目的抽样的方法选取样本
优点
在选取样本的时候不需要精确的抽样框
调查员不必多次去现场才能接触到像概率抽样那样实现确定的受访者
缺点
给予调查者过多的自由处置权,很难说明样本的代表性,容易产生样本选择的偏倚
空间抽样
是对具有空间关联性的各种调查对象及资源进行抽样的一种方法
特点
调查对象具有地理空间坐标,如果改变空间对象的位置,则改变了抽样调查总体,影响抽样调查的结果
在空间抽样的过程中,个人主观经验的不同会给抽样结果造成较大的影响
适用范围
多用于生态、海洋、渔业、林业、农业、人口健康、环境、土壤及水资源等方面得到广泛应用
数据质量评价指标(信度、效度)
效度
定义:=真实性、准确度,意在调查表确实测定了研究者所要测定的特征及其程度,即测量指标或观察结果在多大程度上反映了所测对象信息的客观真实性
偏倚
内容效度
=内在效度,是指调查表测量的内容与索要测量的内容之间的符合情况
评价
主要通过主观经验判断
结构效度
=构思效度或特征效度,说明调查表的结构是否符合理论构想和框架,即调查表是否真正称量了所提出的理论构思
评价
复杂
采用验证性因子分析来揭示众多条目之间内在的联系,判断是否与理论构想一致
标准关联效度
=效标效度,是调查表所得数据与某种外部标准(效标)间的关联程度
评价
测量数据与效标之间的相关系数表示
效标可以是该调查表以外一些客观指标或从另一种调查表得到的数据
信度
定义:=可靠性、稳定性、一致性、精确度,反映的是观测误差引起的变异程度
变异
重测信度
指用同一调查表在不用时间对同一组调查对象进行重复测量,两次结果间的一致性
评价
两次测量结果的相关分析=稳定性评级
说明了使用同一测量工具重复测量时所得结果的稳定性
分半信度
在一次测量后将条目分为相等但独立的两个部分,分别计算两个部分的得分,并以其相关系数作为信度指标
实际上考察的是指标的一致性
两部分之间的相关系数只表明一般条目的信度,需要用Spearman-Brown公式来确定整个调查表的信度
内部一致性信度
是以条目之间的联系程度对信度作出估计,是分半信度的推广
评价
克朗巴赫α系数
两者关系
信度高效度未必高,信度低则很难有高的效度
效度更重要,一个效度很低的调查即使信度高也是没有意义的
信度与效度的考评大多是计算各种相关系数,一般来说0.9以上认为很好,0.7以上为好,低于0.4为差
调查设计的基本内容
抽样调查
抽样调查:是从总体中抽取一定数量的观察单位组成样本,用样本信息推断总体特征
分类
(1)抽样方式分:概率抽样调查和非概率抽样调查
(2)时间维度分:横断面和纵向(回顾性、前瞻性、双向性)
(3)调查性质分:定量调查、定性调查
1、调查目的
为了估计总体参数,说明总体特征(单个总体)
研究事物之间的联系(两个或多个总体)
调查目的是通过具体的调查指标来体现的:调查指标要尽量用客观性强、灵敏度高、精确性好的指标
2、调查对象与观察单位
确定调查总体(同质)中的个体
调查对象要具体,明确调查的人群及调查的时间和地点
观察单位是指组成总体的个体
3、调查方法和调查项目
概述
1、根据调查目的、调查对象和具备的调查条件来确定调查方法
2、根据调查指标确定调查项目,即调查的具体内容,包括分析项目和备查项目
(1)分析项目:是直接用于计算调查指标以及探讨因素之间关系所必需的内容
(2)备查项目:是为了方便核查而设置的,通常不用于直接分析,如姓名、地址、编号
调查方法
观察法
如一些客观指标(身高、体重等)、一些行为方式的调查(如医生对病人的态度)
问卷法
对于一些主观指标和一些无法通过检查获得的客观数据
访谈法
调查表的内容
标题
说明
1、说明目的和意义
2、自填式问卷还可有填表须知、交表时间、地点及其他说明事项
3、宣传
基本情况
基本人口学特征:性别、年龄、民族、文化程度、婚姻状况、职业、家庭人口等
(用于分组,但并非多多益善)
主要内容
编码
作业证明的记载
调查表的制定步骤
明确目的
提出项目
项目筛选
确定项目的提问形式
类型
1、开放性问题
2、封闭性问题
问题的设置
避免不确切的表述
避免判定性的问题
避免引导性问题
避免难堪或禁忌的敏感问题
避免笼统和抽象的问题
避免多重问题
确定项目的回答选项
预调查及评价
修改完善
4、组织计划和实施
组织领导
任务分工
调查员选择和培训
宣传动员
时间进度
经费预算
调查表和宣传资料的印刷
器材的准备等
5、数据整理分析计划
在研究设计阶段就应该制定!
1、问卷核查
完整性
逻辑性
2、数据编码
3、数据录入
4、数据整理
5、数据分析
第十五章 实验研究设计
实验设计的基本内容、基本原则
基本内容
1、研究目的
形成研究假说
1、假说是以一定的探索性研究或科学理论为依据提出的
2、科学假说具有科学性和猜测性两个显著特点
3、假说既是对研究结果的解释,也是进一步研究的起点
确定研究目的
将研究假说具体化即为研究目的
2、实验对象
定义:是接受处理因素作用的基本单位,也叫研究对象
分类
以动物、器官、细胞或血清等生物材料为实验对象的动物实验
以某病患者为试验对象的临床试验
以人群为试验对象的现场试验
选择实验对象
明确对象的总体范围
注意样本的同质性和代表性
在选择前应明确纳入标准和排除标准
试验对象的计数单位要跟库具体情况决定
还需注意以下问题(若试验对象是动物)
1、应明确种属、品系、年龄、性别、体重、窝别和营养状况等
2、生物学特性与研究目的相适应
3、功能、代谢和疾病特征与人类相似
4、成年动物、雌雄各半、排除孕期和哺乳期动物,符合伦理要求
5、3R原则
减少:尽可能减少实验中所用动物的数量,提高实验动物的利用率
优化:减少动物的精神紧张和痛苦
替代:不利用活体动物进行实验,而是以单细胞生物、微生物或细胞、组织、器官等加以替代
3、处理因素
概念
处理因素:是根据研究目的施加于研究对象的干预因素,可以是物理、化学、生物因素
处理水平:处理因素在剂量或强度上的不同
分类
单因素多水平
实验只有1个处理因素,处理因素水平数大于1
多因素多水平
实验同时有多个处理因素,每个处理因素均有多于1个水平
处理因素标准化
在实验过程中,同一组内各个体接受的处理因素应保持不变,包括处理因素的施加方式、力度、频次和持续时间等
非处理因素
在确定处理因素的同时,还需根据专业知识和实验条件明确可能对研究结果产生影响的非处理因素,即混杂因素或协变量,并加以控制
非处理因素取决于研究对象本身,主要指难以人为改变、可能对研究结果有影响的因素
往往通过随机化分组等方法,使非处理因素尽可能在各组中分布均衡,最大限度地控制非处理因素对研究结果的影响
4、实验效应
概述
1、实验效应:处理因素施加给试验对象后产生的效应或反应
2、实验效应可用观察指标来度量
3、观察指标与研究目的必须存在本质的联系,并能确切反映实验效应
分类
主观指标
试验对象的主观感受、记忆、陈述或观察者的主观判断
与实验对象和观察者既往的经验有关,并易受试验对象和观察者心理因素的影响
客观指标
是指借助仪器设备测量所得
具有较好的真实性和可靠性
半客观指标
有些指标虽然是客观的,但判断上受到主观因素的影响,如X关片的结果
注意的问题
准确度
观察值与真实值的接近程度
受系统误差影响
通常用绝对误差和相对误差来表示观察指标准确度的大小
精密度
相同条件下对同一对象的同一指标进行重复观察时,观察值与其均数的接近程度
主要受抽样误差影响
常用变异系数、标准差、方差等来表示观察指标的精密度大小
对比记忆,调查研究中的效度与信度,即真实性与可靠性
灵敏度
该指标检出真阳性的能力
指用该指标检出效应差异的能力
灵敏度高能将处理因素的效应更好地显示出来
特异度
指用该指标检出真阴性的能力
指用该指标鉴别无效应差异的能力
特异度高的指标不易受混杂因素的干扰
基本原则
对照
控制潜在因素的混杂影响
空白对照
对照组不接受任何处理
常用于动物实验
临床上用于安慰剂及盲法无法执行或执行困难的情况
安慰剂对照
是一种无药理作用的制剂,不含试验药物的有效成分,但其外观、大小、颜色、重量、气味、及口味等都与试验药物一样,不能为患者所识别
适用于研究的疾病尚无有效治疗药物或使用安慰剂后对该病情、临床过程、预后无影响或不利影响小的情况
一般与盲法结合使用
对于急、重或器质性疾病的研究不宜使用安慰剂对照
实验对照
对照组不接受处理因素,但接受某种与处理因素有关的实验因素
标准对照
用现有公认的标准方法或常规方法作为对照
常用于某种新方法是否能代替传统方法的研究
自身对照
对照与试验在同一对象身上进行,如身体对称部位或试验不同阶段分别接受不同的试验因素
简单易行,使用广泛
若试验前后某些自身因素或环境因素发生了改变,并且可能影响试验结果,则需另外设立一个平行的对照组,用实验组与对照组处理前后效应的差值来进行比较
互相对照
各实验组(如同一药物的不同剂量组)互为对照,不专门设立对照组
随机
使各处理组研究对象的基本情况相同
分类
随机分组
完全随机
直接对试验对象进行随机分组
分层随机
先按混杂因素将试验对象分为若干层,再对每一层内的试验对象进行随机分组
实验顺序随机
指每一个实验对象均有相同的机会先后接受处理
重复
减少随机误差
三层意义
整个实验重复
多个实验对象进行实验
同一实验对象的重复观察
实验研究过程中误差来源及质量控制措施
误差来源
概念
1、随机误差:一类不恒定,随机变化的误差。实验过程中在同一条件下对同一对象反复进行测量,每次测量结果难免出现一些随机性的变化
2、非随机化误差=系统误差或偏倚:由各种人为因素或偶然因素造成的,涉及研究者和实验对象,并贯穿于实验设计、数据收集、整理和分析的全过程
非随机误差
选择偏倚
由于选择实验对象的方法不正确,或纳入和排除标准不明确
测量偏倚
=信息偏倚,由于研究者的主观原因或实验仪器、实验对象的客观原因而产生的观察或测量偏倚
混杂偏倚
由于某种非处理因素与处理因素同时并存而影响到观察结果,导致处理因素与效应之间的联系被歪曲
质量控制措施
设计阶段
数据收集阶段
研究人员的仔细选择与认真培训
盲法
定期督导和检查研究记录
采用有效措施减少研究对象的失访,提高依从性
数据整理分析阶段
检查记录的完整性与正确性
分层分析或多因素分析
常用的设计类型概念与特点、分组方法
概述
单处理因素设计
只安排一种处理因素,不安排任何配伍因素→完全随机设计
若安排一种配伍因素→随机区组设计
若安排两种配伍因素→拉丁方设计
多处理因素设计
析因设计
正交设计
裂区设计
完全随机设计
=简单随机设计:采用完全随机化分组方法将同质的实验对象分配到不同的组,各组分别接受不同的处理
分类
各组样本量相等→平衡设计
各组样本量不等→非平衡设计
优点
设计简单、易于实施
缺点
样本量较小时,均衡性较差
与随机区组设计相比,效率较低
分组方法——直接对实验对象进行随机化分组
随机数表法:对实验对象编组,再用随机数表随机选择编码。编码时要注意编码的位数是一致的,这样才能保证每一个编码都有相同的机会被选中
样本量估计
观测指标的变异程度
各对比组间参数差异
检验标准α
检验效能1-β
配对设计
是将实验对象按一定条件配成对子,再将每对重的两个实验对象随机分配到2各不同的处理组
配对因素应为影响实验结果的主要非处理因素
随机区组设计
=配伍设计,将几个实验对象按性质(如动物的性别、体重,患者的病情、性别 、年龄等主要非处理因素)相同或相近者组成区组(或配伍组),再分别将各区组内的实验对象随机分配到几个处理组
原则:区组间差别越大越好,区组内差别越小越好
优点
每个对子和区组内的实验对象具有较好的同质性,比完全随机设计减少了误差
消除了非处理因素对结果的影响
更容易发现处理组间的差异,提高了实验效率
缺点
要求对子或区组内的处理因素个数与每个区组的实验对象数量相同
析因设计
要区别随机区组设计
将两个或两个以上处理因素的各水平进行组合,对各种可能的组合进行实验。
随机区组设计是一个处理因素(可以分k个水平),和一个非处理因素
多用于研究两个或多个处理因素的效应以及各因素间的交互作用
要求:各处理组内的实验对象数量相等且每组至少有两个实验对象,否则无法分析因素见的交互作用
主效应:全面衡量对各因素的不同水平进行组合,分组进行实验,探讨各因素不同水平的效应
交互作用:各因素间的相互作用
优点
可以全面均衡地对各因素的不同水平进行组合,分组进行实验,探讨各因素不同水平的效应,即主效应
同时可分析各因素见间的交互作用
交互作用:是指两个或多个处理因素间的效应互不独立,当某一因素取不同水平时,另一个或多个因素的效应相应地发生变化
临床试验和群随机试验的基本概念、特征
临床试验
基本概念
目的:揭示或证实产品的临床、药学或其他药物动力学的效应,识别、研究产品的不良反应、安全性或效果,或试验药物的吸收、分布、代谢及排泄而在人身上进行的研究
广义:在人为控制条件下,以特定人群为受试对象(患者或健康志愿者),以发现和证实干预措施(药品、特殊检查、特殊治疗手段)对特定疾病的防治、诊断的有效性(包括药品的作用、吸收、分布、代谢、排泄)和安全性(不良反应)
用途:疾病的治疗和预防效果评估
分四期
Ⅰ期:初步的临床药理学及人体安全性评价试验。观察人体对新药的耐受程度和药代动力学,为制定给药方案提供依据
Ⅱ期:治疗作用初步评价阶段。初步评价药物对目标适应证患者的治疗效果和安全性,也包括为Ⅲ期临床试验研究设计和给药剂量方案的确定提供依据
Ⅲ期:治疗效果确证阶段。进一步验证药物对目标适应证患者的治疗效果和安全性,评价利益与风险,为药品注册申请的审查提供依据
Ⅳ期:新药上市后的研究阶段。考察在广泛使用条件下药物的疗效和不良反应、评级在普通或特殊人群重使用的利益与风险关系以及改进给药剂量
基本类型
平行设计
可设置一个或多个对照组,试验药也可以设置多个剂量组
阳性对照一般采用按所选适应证的当前公认的有效药物
阴性对照一般采用安慰剂,但必须符合伦理
优点
设立同期对照组,使试验组和对照组在同等时间和条件下进行效果比较
随机化分组平衡了两组的非处理因素,有利于凸显处理因素的作用
通常使用盲法观察结果,有利于减少研究对象和研究者的主观偏性
实验过程容易做到标准化,利于保证研究结果的可重复性
交叉设计
定义:是按实现设计好的试验顺序,在各个时期对研究对象先后实施各种处理,以比较各处理组间的差异
可以采用完全随机设计或随机区组设计方法来安排受试对象
平衡了处理顺序的影响,而且能把处理水平间的差别、时间先后的差别和实验对象间的差别分开来进行分析
与随机区组设计区别
虽然形式上相近,但交叉设计的处理是按不同时间阶段分别安排的,因而可以减少实验对象的数量
洗脱期:交叉设计中第一阶段与第二阶段之间的间隔时间
原则上应在第一个阶段实验中使用的处理因素作用消失后方可进入第二阶段实验,否则两阶段的处理效应重叠
如果是药物,一般为药物的6~8各半衰期
还应注意处理因素的生物作用特点
交叉设计最简单的形式是完全随机分组的二处理、二阶段交叉设计
优点
节约样本量,统计效率较高
兼有异体和自身配对的优点,减少了个体差异,从而增加了组间可比性,能够控制个体差异和时间对处理因素的影响
每个受试对象同时接受了两种处理,均等地考虑了每个患者的利益
缺点
每一个处理时间不能太长,因在同一对象作了多种处理,处理时间过长会导致整个试验周期过长,受试对象可能中断试验
受试对象的状态发生根本变化时,如死亡、治愈等,后一阶段的处理将无法进行
受试对象一旦在某一阶段退出试验,就会造成该阶段及其以后的数据缺失,增加统计分析的难度
注意点
各处理不能相互影响,不能有前一种处理的残滞效应
应采用盲法进行观察,提高受试对象的依从性
不宜用于具有自愈倾向或病程较短的疾病研究
群随机试验(CRT)
概述
1、=成组随机试验
2、前述的以单个实验对象为随机单元的试验也称为个体随机试验
3、群随机单位多种多样:社区、工厂、医院、学校、邻里、车间、病房、家庭等
应用
以人为试验对象的研究中,干预措施虽针对个体,但由于人的社会性所导致的交流、流动等使对照组受到干预措施的影响而产生沾染
干预措施针对群体而非个体
基本概念
研究对象以群组为单位进行随机分配的一种试验
基本特征
优点
可有效降低对照组受干预组沾染的可能性
是某些干预措施如健康教育或政策措施效果评价最合适的研究方法
有利于评级具有群体效应的干预效果
便于实施且提高个体依从性(从众心理)
缺点
同一群体内个体对干预措施的反应比不同群体间的反应具有更大的相似性,因为统计效能低于个体随机试验。用群内相关系数(ICC)反映
设计和分析更为复杂
采用个体随机试验样本量估计公式将低估群随机试验的样本量,从而导致研究的检验效能较低
群的数量较少时难以保证群间基线协变量均衡可比
一般而言,群的数量越少,群间基线的变异程度越大,越难以通过随机化的方法保证群间基线均衡可比
常见类型
单因素
完全随机设计
1、无任何限制条件,完全按照随机化的方法将群分配到试验组和对照组的分组方法即完全随机设计
2、过程简单、较易操作
3、是以”群“为随机单元试验设计的”金标准“
4、群数目足够多的情况下,可确保影响试验结果的重要非干预因素在干预组与对照组之间保持最佳均衡性
5、但群数不多时,难以保证群间的基线资料均衡可比
配对设计
1、这种随机化分组时首先按重要非研究因素对群进行配对,然后将每一对子重一个群随机分配到试验组,另一个群分配到对照组的方法即为配对试验
2、优点:保证重要非研究因素良好的均衡性,提高了试验的可信度;当群数目太少时,即使不是”金标准“,但也是常用的设计方法
分层设计
1、首先按照重要非研究因素对群进行分层,然后将每一层中一些群随机分配到试验组,另一些群分配到对照组中
2、与配对最大的不同:配对中重要非研究因素相同或相近的是2个群,而分层设计有若干群
3、优点:
最大限度保证基线水平在组间的均衡性
是配对设计的拓展,一定程度上实现了干预和层组合基础上的重复
4、缺点:
实施困难
群数目少时,重要非研究因素较多时,无法进行
多因素
析因设计
1、将两个或多个因素的各个水平进行交叉组合,按照完全随机设计对群进行分组,各组分别接受想听干预措施的方法
2、统计分析较为复杂
3、群数不多时,难以保证群间基线资料均衡可比
注意的问题
确定个体水平和群体水平的纳入和排除标准
群随机设计的样本量问题
1、由于同一群内具有一定相关性而带来群效应
2、样本量估计时还需知道群内相关系数或群间方差组分估计值