导图社区 医学统计学(第三版)
353公共卫生考研;医学统计学,涵盖了一、几个重要名词、二、基本概念、三、统计分析、四、研究设计、五、两个专题。
编辑于2025-04-23 17:00:28353公共卫生考研;医学统计学,涵盖了一、几个重要名词、二、基本概念、三、统计分析、四、研究设计、五、两个专题。
这是一篇关于营养与食品卫生学的思维导图,详细覆盖了从营养学基础到特殊人群营养、临床营养以及食品安全与监督管理的广泛领域。简要概述了学习材料的内容和目的。随后,进入第一章营养学基础,详细讲解了蛋白质、脂类、碳水化合物、能量、矿物质、维生素等营养素的基础知识。介绍了食物中的生物活性成分,如类胡萝卜素、多酚类化合物、皂苷类化合物等。
这是一篇关于环境卫生学的思维导图,内容详尽地概括了环境卫生学的定义、研究对象、研究内容、发展简史以及具体的分支领域。环境卫生学为充分利用环境有益因素和控制环境有害因素提出卫生要求和预防对策,增进人体健康,维护和提高人群健康水平的学科”。详细列出了环境卫生学的研究内容,包括自然环境与生活环境对人类健康的影响、大气卫生、水体卫生、土壤卫生等多个方面。
社区模板帮助中心,点此进入>>
353公共卫生考研;医学统计学,涵盖了一、几个重要名词、二、基本概念、三、统计分析、四、研究设计、五、两个专题。
这是一篇关于营养与食品卫生学的思维导图,详细覆盖了从营养学基础到特殊人群营养、临床营养以及食品安全与监督管理的广泛领域。简要概述了学习材料的内容和目的。随后,进入第一章营养学基础,详细讲解了蛋白质、脂类、碳水化合物、能量、矿物质、维生素等营养素的基础知识。介绍了食物中的生物活性成分,如类胡萝卜素、多酚类化合物、皂苷类化合物等。
这是一篇关于环境卫生学的思维导图,内容详尽地概括了环境卫生学的定义、研究对象、研究内容、发展简史以及具体的分支领域。环境卫生学为充分利用环境有益因素和控制环境有害因素提出卫生要求和预防对策,增进人体健康,维护和提高人群健康水平的学科”。详细列出了环境卫生学的研究内容,包括自然环境与生活环境对人类健康的影响、大气卫生、水体卫生、土壤卫生等多个方面。
医学统计学(第三版)
一、几个重要名词
第1章绪言
1.2.1统计工作的步骤
(1)研究设计
是在医学研究中运用医学统计学的起点
也是高质量地完成整个研究的重要基础。
(2)收集资料
(3)整理资料和资料分析
是在研究设计基础上,通过实验(试验)或调查
将所得数据进行统计学处理的过程。
(4)结论(解释结果)
是在数据分析的基础上,依据统计学处理的结果,进行统计学推断;
同时,结合相应的专业 知识,作出专业性的结论。
1.2.2三类资料及变量分类
1、三类资料
1、类型
(1)定量资料
1、定义
以定量值表达每个观察单位的某项观察指标,如血脂、心率等。
2、特点
①观察指标在各观察单位间只有量的差别;
②数据间有连续性。
(2)定性资料
1、定义
以定性方式表达每个观察单位的某项观察指标,如血型、性别等。
2、特点
①观察指标在各观察单位间或者相同,或者存在质的差别;
②有质的差别者之间无连续性。
(3)等级资料
1、定义
以等级方式表达每个观察单位的某项观察指标.如疗效分级、血粘度、 心功能分级等
2、特点
①观察指标在各观察单位间或者相同,或者存在质的差别;
②各等级间只有顺序,而无数值大小,故等级之间不可度量。
2、各类资料间的转换——定量→等级→定性
①如智商(IQ)值——定量资料→下等、中下、中等、中上和上等——等级资料→“正常”,“不正常”——二分类(定性资料)
②如临床疗效,痊愈、显效、进步、无变化、恶化——等级资料→“有效”,“无效”——定性资料°
2、变量的分类
1、变量
变量就是观测单位的某种特征或属性,变量的具体取值就是所谓的变量值
2、观测单位
每个被调查对象称之为观测单位
3、分类
1、定量变量(计量变量/数值变量)
(1)定义
指有数值特征的数据,通常有单位。
像年龄、家庭人口数这类变量的取值是定量的,我们称为定量变量。
(2)分类
1、连续变量
有度量衡单位,通常变量取值范围在理论上可以取到任意区间内的正实数,其取值范围是连续不间断的。
如身高、年龄。
特点:有度量衡单位,有数值上的大小
2、离散变量
相对连续变量的另一类定量变量,其取值范围间断而不连续。
如家庭人口数。
(只能是整数)→不具分类性质的离散型资料
2、定性变量
(1)定义
其取值往往表现为互不相容的类别或属性。
像学历、婚姻状况和就业状况这类变量的取值是定性的,称为定性变量。
(2)分类
1、有序分类变量
取值的各类别之间存在着程度上的差别,
给人一种”半定量”、等级或顺序的感觉,又称等级变量。
进而可以比较优劣,如学历分文盲、小学、初高中及以上
特点:将观测对象的某种属性的不同程度进行分组计数
2、无序分类变量
(1)定义
各个取值间没有程度的差异,没有顺序差别,仅作分类。
(2)根据取值的不同分
①相互对立的两类的二项分类变量(如性别)
②互不相容的多个类别的多项分类变量(如血型、职业)。
特点:将观测对象的某种属性或者类型进行分组
1. 2. 3 总体和样本
1、总体
(1)定义
是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
(2)例子
例如, 研究某地某年青少年的身体发育,以16岁男子的身高为例
研究对象——该地该年所有的16岁正常男 子
观察单位——其中每一个人的身高
这里的全部身高值就构成了一个总体。
(3)分类
①有限总体
有限总体的观察单位数是有限的;
②无限总体
无限总体的观察单位数是无限的;
2、样本
(1)定义
指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
(2)例子
如上 述糖尿病患者疗效的研究,若从此类患者随机抽出100例进行,后者即构成一个样本,样本含量是100个观察单位数,常用n表示。
3、同质性
(1)定义
同一总体或其样本中的观察单位在所取指标方面必须具有相同的性质,称为同质性
(2)涵义
对观察单位有影响的因素相同或相近。
4、异质性
与同质性相反的是异质性或间杂性。
5、变异/个体变异
某项观察指标取值在其观察单位之间显示的差别。
由于观察单位通常即观察个体,故变异亦称个体变异
1.2.4参数与统计量
1、参数
(1)定义
描述某总体特征的指标称为总体参数,简称参数;
总体参数是事物本身固有的,在设定条件下是不变的;
(2)例子
例如,某地所有健康成年男子的白细胞计数构成一个研究总体,则所有健康成年男子的白细胞计数之均值是参数;
2、统计量
(1)定义
描述某样本特征的指标称为样本统计量,简称统计量。
样本统计量随着所抽取样本的不同而不同, 但统计量的分布是有规律的,这种规律是统计推断的理论基础。
(2)例子
如从该地随机抽取一定数量的成年男子,检测每人的白细胞计数,其均值是统计量,为相应参数的估计值。
(3)统计量偏倚
(1)定义
抽样分布的均值与待估计参数的差值称为统计量的偏倚
(2)性质
①当偏倚为零时,则称该统计量时相应参数的无偏倚估计。
②偏倚反映的是样本均数与真实值的差。
③偏倚关注的是抽样分布的集中位置。
④采用随机化方式,可降低统计量的偏倚,但不能消除偏倚。
(4)统计量变异
(1)定义
由抽样引起的统计量与总体参数之间或统计量取值之间的差异。
(2)性质
①反映的是样本方差的大小。
②变异关注的是抽样分布的离散形态。
③通过增大样本量可降低统计量的变异。
1.2.5概率
1、概率(未知)
(1)定义
是随机事件发生可能性大小的一个度量,常用P来表示,取值范围为0≤P≤1。
本质→可能发生率
适用对象→总体
(2)基本性质
①任何概率取值为0~1。
②所有可能的结局的概率加起来必须等于1。
③如两个事件互斥,两个事件至少一个发生的概率就是两个事件单独发生的概率之和,即概率的加法原则。
④一个事件不会发生的概率等于1减去这个事件会发生的概率。
2、频率(已知)
n次随机试验,随机事件A发生了m次,
则称A发生频率为f=m/n,m称为频数,0≤f≤1
本质→实际发生率
适用对象→样本
3、小概率事件
(1)定义
当某事件发生的概率小于或等于0. 05时,统计学通常称该事件为小概率事件
(2)涵义
该事件发生的可能性很小,认为其在一次抽样中不可能发生,即为小概率原理
是进行统计推断的理 论依据之一。
1.2.6统计描述与统计推断
1、统计描述
即采用统计图、统计表、相关的统计指标等方法,
对资料的分布规律和数量特征进行简单的描述和计算。
2、统计推断
(1)含义
用样本信息推论总体特征。
包括参数估计和假设检验。
从样本数据推理而得到关于总体的结论,该过程称为统计推断。
(2)基本思想
用样本得到的结论,来”猜测”总体的真相,即通过样本数据估计总体特征。
(3)类型
①参数估计
运用统计学原理,
根据样本计算出来的统计量,对总体参数进行估计
②假设检验
(1)含义
又称显著性检验,
是指由样本间存在的差别,
对样本所代表的总体间是否存在着差别作出判断。
(2)类型
①参数检验
以特定的总体分布为前提,
且对未知总体参数作出推断的假设检验方法。
②非参数检验
不依赖于总体分布类型,也不对总体参数进行推断,
而是对总体分布进行比较的假设检验方法。
③参数检验和非参数检验的比较
(4)统计分析五步法
①定量资料
②分类资料
(5)统计分析的解题思路
①定量资料
②分类资料
二、基本概念
第2章 个体变异与变量分布
2.2频数分布
2.2.1 定量资料的频数分布
1、频数分布表
(1)定义
将定量资料人为地划分为若干个相连接的区间,统计每个区间所包含的观察值个数
当变量值个数较多时,对各变量值出现的频率进行列表即为频率分布表,简称频率表
可简便直观地揭示变量的频数分布、特征和分布类型。
(2)编制步骤
①找出最大最小值
将数据按从小到大排序。
②计算全距(R)
最大与最小值之差,也称极差。
③确定区间个数,即组段数(k)
组段数一般取8~12个为宜
④确定组距(ω)
a、组距=全距/组段数。
b、一般取整数或方便计算的数值。
c、第一组应包含最小值,最后一组应包含最大值。各组段要连续不能重叠。
⑤确定各组段的上、下限
a、组段起点为下限,终点为上限,每一组段的下限值为前一组段的上限值。
b、除最后一组,每组组段均包含组段的下限值,但不包括该组的上限即为半闭半开区间,最后一组要求写出上限。上下限一般取整数。
⑥列表整理
得到频数、频率、累计频数、累计频率。
(3)形式
三线表
(4)结构
①3基本(顶线、底线、纵标目分隔线)
②5要素(标题、标目、线条、数字、备注)
(5)制表原则
①重点突出,简单明了
②主谓分明,层次清楚
③结构完整,有自明行
(6)种类
①简单表
②复合表
(7)用途
①揭示资料分布类型【对称分布or非对称分布(正偏态or负偏态)】
②描述频数分布的重要特征(集中趋势or离散趋势)
③便于发现特大、特小的可疑值
④便于进一步计算统计指标和做统计处理
⑤当样本含量比较大时,可用各组段的频率作为概率的估计值;
2、频数分布图
(1)定义
用点的位置,线的升降、面的大小表达统计资料数量关系的一种形式
(2)结构
(1)图形
根据资料性质和分析目的合理选择。
(2)标题
在图的下方,说明图的内容,必要时包括时间、地点等研究信息。
(3)标目
纵横轴应注明单位,纵横轴之比以 5:7为宜。
(4)图例
在图内的右上角或标题之上。
(3)常用统计图
1、直方图
(1)定义
用矩形的面积表示某个连续变量的频数或频率分布
(2)绘制步骤
①横轴上标出各组段。
②用直条的高度或面积表示各组段的频数。
(3)绘图注意
纵轴坐标要从0开始
(4)用途
表达个组段的频率或频数
(5)举例
描述身高、体重的分布
2、箱式图
(1)定义
也叫箱线图,因为中间包含一个状似箱子的长方形、两端有两根细线而得名。
矩形箱子反应中间50%的数据,
(1)用途
①描述数据的集中与离散趋势
②结合中位数四分位数间距的大小判断数据分布类型
③通过箱体高度的1.5倍(或3倍)判断离群值(或极端离群值)
④实际应用中,往往将几组数据的箱式图绘在一起,便于组间的比较。
(3)作用
箱式图表达的信息更为全面,能简洁地呈现数据平均水平和变异程度的一系列关键指标值,是探索性分析中最常用的图形工具。
(4)指标的含义
①最小值——箱体下伸出来的细线
②最大值——箱体上伸出来的细线
排除了极端值和离群值以外的其他观测值中的最小值和最大值。
③下四分位数P25——箱体的下端
④上四分位数P75——箱体的上端
⑤箱体的高度——四分位数间距(IQR)
箱体越高表示数据变异程度越大
⑥中位数P50——箱子中间的横线
a、横线在箱体中间位置→表明数据呈对称分布
b、中间横线靠下端→(中位数下移变小,则表示右偏态
c、中间横线靠上端→中位数上移变大,则表示左偏态。
(5)适用于多组数据的比较
(6)举例
如某地不同类型化妆品厂车间粉尘分布箱式图
3、箱式百分位数图
(1)定义
结合了基本箱式图和直方图的功能。
利用数据的所有百分位数信息,对箱体的宽度赋予权重,描述整个数据的分布形态,较箱式图更直观。
箱体中间位置权重越大,箱体最宽;越往两端权重减小,箱体变窄。
对所有数据进行了描述,若关于中位数上下对称,则提示资料呈对称分布。
(2)与基本箱式图的比较
①箱式图
对离群点进行了定义,并对这些离群的个体值单独描点,
具有显示数据中的离群值或极端值的优点。
②箱式百分位数图
并没有特别标出离群值,可从图中直观判断。
根据对应箱式百分位数图从箱体往下或上延伸出来一条又长又细的线可以判断。
(3)箱式百分位数图的绘制
首先通过原始数据确定图形的纵坐标位置,
再将n个观测值从小到大排列,假设箱体最中间(中位数位置)宽度为w,
第k个观测值Xk所在位置的宽体为
Xk小于M时:Kw/(n+1);
Xk大于M时:(n+1-k)/(n+1);
箱式百分图还可根据需要在相应位置添加横线描述其他的百分位数。
4、线图
①概念
以线段的升降表示事物在时间上的发展变化
或一种现象随另一种现象变迁的情况。
②类型
①普通线图
①概念
横轴、纵轴均为算术尺度,
反映事物数量变化的绝对差别,
用于描述事物的变化趋势。
②适用
单纯比较变化幅度,绝对量相差不悬殊。
③绘图注意
纵轴坐标可以不从0开始
④举例
如某地1997-2001年艾滋病和梅毒发病率的增长幅度
②半对数线图
①概念
横轴为算术尺度、纵轴为对数尺度的线图,
反映事物数量变化的相对差别,
描述事物的变化速度。
②适用
绝对量相差悬殊事物的比较。
③举例
如某地1997-2001年艾滋病和梅毒发病率的增长速度
5、散点图
①适用资料
双变量连续型资料
②绘图注意
纵轴坐标可以不从0开始
③用途
可呈现两边量的某种趋势,分析其变化方向
2. 2.2定性资料及等级资料的频数分布
1、频数分布表
(1)定义
根据指标值的不同属性进行的(如性别、疾病分类)
或统一规定的(如心功能I — IV级)
或人为界定的(如体重的正常范围、超重范围和肥胖范围)。
经归类汇总各类的频数,并形成分布。
2、频数分布图
1、直条图
①定义
用等宽直条的长短来表示相互独立的各指标的数值大小
②适用资料
相互独立、无连续关系的资料
③绘图注意
纵轴坐标一定要从0开始
④用途
直线长短表示数值大小
⑤类型
单式条图
a、单个率在不同年份的对比,或只比较多个率;
b、绘图时。注意纵轴必须从0开始且等距,注意排列顺序。否则各个条柱的相对比例发生改变,有夸大差异之嫌。
复式条图
a、除了比较多个率,还可以比较不同年份的差异
b、绘图时,注意颜色区分,附图例。
如常用于xx年的发病率,不同年代两种病人的发病率可用复式条图
比如:我国大陆2010年和2013年四种虫媒传染病发病率。
2、百分条图
①适用资料
构成比资料
即可用于一组数据,又可用于比较多组数据的内部构成
比如:西藏林周县和桑日县4-12岁儿童大骨节病监测结果。
3、饼图
①定义
又称圆图,将圆形分割成若干个扇形,
扇形面积的大小表示同一个事物内部中各部分的构成比。
比如:西藏尼木县青稞籽粒真菌菌属构成。
②适用资料
构成比资料
了解一组数据的内部构成
适用于描述分类变量的构成比,用于说明事物内部各组成所占比重。
③绘图注意
①通常从12时处开始,按大小或自然顺序顺时针方向排列。
②简要标注各扇形所代表的类别和百分比。
直观表达各部分所占比例
4、统计地图
①定义
根据不同地方某种现象的数值大小,
采用不同密度线条或不同颜色绘在地图上,
②用途
①主要用于表示某种现象在地域空间上的分布
②有助于分析该现象的地理分布特征,为进一步研究提供线索
③举例
如某急性传染病发病数在中国内地的分布情况
5、热图
①用途
用不同颜色(或深浅)表示观测值的大小
常用来表示疾病的时间和空间分布,
生物信息学中也常用热图描述基因表达谱。
②注意
热图采用构成比反映同一个省份疫情随月份的变化趋势,
不能用于直接比较各省份疫情严重程度,
疫情严重程度的比较宜采用空间分布地图来表示。
③举例
比如:2013 年我国31个省/自治区直辖市手足口病疫情的时间分布。
热图色带表示每个省份各月份的发病人数占全年发病总数的百分比,颜色越深说明当月疫情在一年之中越严重。
相互独立资料/离散型定量变量
2.2.3数据分布的类型
(1)对称分布
(1)定义
大部分数据较集中,越靠两端频数越少,直方图高峰两侧的频数分布基本对称,称为对称分布。
人的很多生理指标,如身高、体重、胸围、血红蛋白含量等都服从或近似服从对称分布。
(2)特点
对称分布时,峰在中间,未拖尾,则众数、均数在中间,中位数亦在中间。
算术均数=中位数=均数
(2)非对称分布——偏态分布
右偏态/正偏态分布
(1)定义
是指尾部偏向数轴正侧(或右侧)的分布,故又称右偏态分布
有小部分数据偏大、直方图呈右侧拖尾的非对称分布。
(如大多数重金属和微量元素在人体内的含量、个人经济收入等)。
正偏态数据经对数转换,往往可以呈现正态分布。
(2)特点
正(右)偏态分布时:峰在左,右拖尾,则众数在左、均数在右,中位数在中间
算术均数>中位数>众数
左偏态/负偏态分布
(1)定义
是指尾部偏向数轴负侧(或左侧)的分布,故又称左偏态分布。
小部分数据偏小、直方图呈现左侧拖尾的非对称分布。如冠心病患者的年龄分布等
(2)特点
负(左)偏态时:峰在右,左拖尾,则众数在右、均数在左,中位数在中间
算术均数<中位数<众数
2.3定量资料的统计指标
2.3.1集中位置的描述
1、概述
1、集中趋势
指一组数据向中心值靠拢的趋势,
反映一组数据中心的位置,
是频数分布表和直方图中间所在位置,即频数最大的组段。
2、平均数
(1)定义
用来描述定量资料集中位置的一组指标体系,
具有对一组变量值的代表性,是分析定量资料的基本指标。
平均数包括算术均数、几何均数、中位数、众数、调和均数等,以前3种较为常用。
(2)注意
要在观察单位同质的前提下应用,不同质的观察单位不宜合在一起求任何平均数。
3、由于个体变异的存在,变量值是分散的,故须通过平均数把它们集中起来,反映其共同趋向的平均水平。
2、常用指标
1、算术均数/均数(`X)
①定义
反映一组变量值的平均水平。
②计算公式
a、直接法
将n个观察值X1,X₂,…,Xn,直接相加后再除以观察值的个数n,即:
b、加权法
权重或权重系数
反映每一部分观察值对均数的贡献
(3)注意
①均数有时须采用加权方法计算。
①易受极大值、极小值的影响
(4)适用条件
最适用于单峰对称分布资料的平均水平的描述
①对称分布资料
②近似对称分布资料
(5)应用举例
人体生理指标
2、几何均数(G)
(1)定义
有些医学资料,如抗体滴度、细菌计数等,其频数分布呈明显偏态
各变量值之间形成倍数关系,经对数变换后观察值如趋向于单峰对称分布,
则宜用几何均数表示其平均水平。
(2)计算公式
①直接法
①将n个观察值X1,X₂,…,Xn,其几何均数定义为n个变量值之积开n次方根:
②对数变换→反对数变换
(3)注意
①变量值中不能有0,因为0与任何数的乘积均为0
②同一组变量值不能同时存在正值和负值。
可采用近似处理
③若变量值全为负值,可在计算时将负号除去,算出结果后再冠以负号。
(4)适用资料
①各变量之间形成倍数关系,经对数转换后呈对称分布
②近似对称分布资料
③具有等比或近似等比关系的资料
(5)应用举例
①疾病潜伏期
②抗原抗体滴度
3、中位数和百分位数
1、中位数(M)
(1)定义
指将一组变量值按从小到大的顺序排列,位置居中的观察值水平
(2)计算公式
(3)适用资料
①分布类型不明确的资料
②或一端、两端开口的资料
③偏态分布
④变量值出现极大、极小值
(4)注意事项
①资料呈对称或近似对称分布资料,应优选均数
②当样本含量较少时不宜用靠近两端的百分位数来估计频数分布范围
(5)优点
中位数的大小取决于中间位置的观测值,不易受两端极值的影响。
比均数具有较好的稳定性,但不如均数精确
(6)与均数相比
①中位数
没有考虑大部分观测值的实际大小
合并后的中位数不能用原来两组数据的中位数表达
中位数不能通过估计截尾均数等方法进行修正
②均数
充分利用了全部的信息。
可基于两组均数和例数可得
可通过估计截尾均数等方法进行修正
常用于一些复杂的统计分析中
2、百分位数(Px)
(1)定义
是一种位置指标,
一个百分位数可将一组变量值分为两部分,理论上有X%的变量值比它小,有(100-X)%的变量值比它大。
对于某一连续分布资料,当指定X%后,Px即为定值;
而对于一组原始数据,Px并不恰好等于某一变量值。
(2)计算公式
n*x%=j
A、如果j为整数,则Px为第j个和第j+1个观测值的平均值;
B、如果不为整数,Px往后取与j相邻的整数数位上的观测值。
2.3. 2离散趋势的描述
1、概述
1、离散趋势
当部分数据偏离中心位置,从各个组段的频数可以大致了解观测值偏离中心的程度,数据的这种变异特征称为离散趋势。
2、变异
一组数据中个体值之间的差异称为变异。
描述变异程度的常用指标有极差(全距)、四分位数间距、方差、标准差、变异系数,它们称离散度测量指标。
其中以标准差和变异系数尤为常用。
2、常用指标
1、全距(R)
(1)定义
全距亦称极差,记为R,是一组变量值中最大值与最小值之差,
反映资料分布的范围,全距大,说明数据的变异度大;反之,则说明变异度小。
(2)适用资料
各种分布类型的资料
(3)缺点
①不灵敏
仅反映最大值与最小值之间的差异,当组内其它数据变动时,全距仍然不变。
②不稳定
当样本例数增加时,获得过大或过小的变量值 的可能性增大,因而全距可能变大。
故全距对变异度的描述是很粗略的,只能用来初步反映变异的大小。
(4)应用举例
常用于传染病、食物中毒的最长、最短潜伏期
2、四分位数间距(IQR)
(1)定义
四分位数是两个特定的百分位数
第25%分位数P%和第75%分位数,分别记为QL 和Qu。
四分位数间距(IQR)定义为Qu — QL,
其间包括了全部观察值的一半。
四分位数间距越大,说明数据的变异度越大。
(2)适用资料
一般用于偏态资料、一端或两端无确切值的资料
(3)特点
不受两端极大或极小数据的影响,比极差要稳定。
常结合中位数描述描述不对称分布资料的特征。
3、方差和标准差
1、方差
(1)定义
指所有观测值的离均差平方和的平均值,描述所有观测值与均数的平均偏离程度。
方差越大,说明数据越离散,变异程度越大。
方差和标准差是一对可以相互换算的指标。
可用来计算标准差
(1)适用资料
①对称分布资料
②近似对称分布资料
(3)注意事项
量纲发生了改变
2、标准差(SD)
(1)定义
是方差的平方根。
是衡量对称分布资料的离散程度的指标,
对于计量单位相同的变量,标准差越大,数据的离散程度越大。
(2)适用资料
①对称分布资料
②近似对称分布资料
(3)特点
①比均数更容易受离群值的影响,个别离群值就能使它明显增大。
②一般与均数结合使用,描述不含离群值的对称分布的分布特征,常写为`X土s
③实际应用过程中,因与原始数据单位一致,应用得更多。
(4)应用举例
①观察值的变异程度
②计算变异系数
③计算标准误
④结合均数描述正态分布特征
⑤求正常值范围
方差和标准差适用于对称分布的数据,特别是适用于服从正态分布或近似正态分布的数据,常与均数结合一起使用。
4、变异系数(CV)
(1)定义
为了了解单位相同,但均数相差悬殊的变量之间的变异程度,
以及比较几个不同单位之间的变量的变异程度,
可以把标准差除以均数,所得到的指标称为变异系数。
是一个度量相对离散程度的指标,
是变异大小(s)相对其平均水平(`X)的百分比。
变异系数值越大,表示变量的变异程度越大。
CV=s/`X*100%
(2)适用资料
①度量衡单位不同的两组或多组资料
如比较同性别,同年龄人群的身高和体重的变异度
②均数相差悬殊的两组或多组资料
如比较儿童体重和成人体重时的变异度
(3)特点
①是一个没有单位的相对指标。
②可以比较几个不同单位的变量的变异程度。
③变异系数值越大,表示变量的变异程度越大。
④变异系数描述的是相对离散度,标准差描述的是绝对离散度。
⑤适用于比较度量单位不同或均数相差悬殊的两组或多组资料的变异程度
⑥理论上的取值范围是(-∞,+∞),(注意不是0~100%)
2. 3.3平均数与变异度的关系
1、描述资料的特征
①用均数和标准差描述正态分布资料得特征
②用中位数和四分位数间距描述偏态分布资料的特征
2、数据的分布越集中,变异程度越小,各变量值与平均数间的距离波动就越小,平均数对各变量值得代表性越好
2.4定性资料与等级资料的统计指标
2.4.1相对数的概念
1、绝对数
反映客观现象总体,在一定时间、地点条件下发生的总体规模、总水平的综合指标
是各类结果的合计频数,反映总量和规模。
如粮食总产量
如某地的人口数、发病人数、死亡人数等
2、相对数
是两个有联系的指标之比,是分类变最常用的描述性统计指标。
包括构成比、率、相对比。
2. 4.2常用相对数
比
①定义
又称相对比,是两个有关的指标A,B之比。
②公式
A/B*100%
③说明
(1)A、B可以性质相同
如相对危险度 RR 值
如新生儿性别比
(2)A、B可以性质不同
如变异系数
(3)A、B两个指标可以是绝对数、相对数、或者平均数等
(4)量纲可有可无,取值没有限制
如RR、变异系数。
比例
①定义
又称百分位数或构成比
用来说明各构成部分在总体中所占的比重。
一般无量纲,取值[0,1]
如死因构成比
②公式
事物内部某一组成部分的观察单位数/事物内部各组成部分的观察单位总数X100%。
②说明
(1)各组成部分的构成比之和为1
(2)某组成部分的构成比发生变化,其他部分的构成比会发生相应变化
③注意:切勿“以比代率”
率
①定义
是一个具有时间概念的指标,
指某种现象在一定条件下,
实际发生某事件或某现象的观察单位数与可能发生该现象的总观察单位数之比,
用于说明在某一时段内某现象发生的频率或强度。
②类型
①频率型指标
Ⅰ、描述某事件在某时期内累计出现的频率。如生存率、死亡率
Ⅱ、其频率分布的合计值为1,无量纲,取值[0,1]。如患病率、某病病死率
Ⅲ、公式=该时期内发生某事件的观察单位数/可能发生某事件的观察单位总数*K
②强度型指标/速率
Ⅰ、描述某现象在观察单位时间内发生的(速)率或强度的率。
Ⅱ、是单位时间内某事件发生的频率。其本质为频率强度,即概率强度的近似值。与频率型指标区别在于“单位时间”的限定。
Ⅲ、实际应用中常称为(速)率,有量纲,取值可能大于1。如某病发病率
Ⅳ、公式=发生某事件的观察单位数/∑可能发生某事件的观察数x观察时长*K
③公式
④说明
应用率时,应注明观察时期的时间单位。
2.4.3正确应用相对数
①计算相对数时例数不宜过少
②分析时不能以构成比比代替率。构成比只能说明事物内部各组成部分的比重或分布,并不能说明某现象发生的频率或强度。
③对观察单位数不等的几个率,不能直接相加求其平均率(或称总率)
④比较相对数时应注意其可比性
⑤不能根据样本率和构成比的差别作结论,需要进行假设检验。
2.4.4率的标准化
①含义
采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。
②目的
消除内部构成不同对总体率的影响,使通过标化后的校准化率具有可比性。
③方法
(1)直接标化法——绝对数(如标准人口数、标准人口数构成比)
①条件
已知两地各年龄组的患病率(Pi)️
需要利用标准组各年龄组人数(Ni)或构成比(Ni/N)。
②计算过程
Ⅰ、选定标准人口(如分类变量合并两组作为标准)️
Ⅱ、计算
→标准人口的预期治愈人数=标准治疗人数(Ni)x原治愈率️(Pi)
→两种疗法的标准化治愈率=预期治愈人数之和(∑NiPi)/标准人口数(N)
(2)间接标化法——相对数(如标准组各年龄组死亡率、标准组总死亡率)
①条件
已知两地各年龄组人数(Ni)或实际死亡人数总数️
需要利用标准组各年龄死亡率(Pi)及标准死亡率(P)。
②计算过程
Ⅰ、选定标准发生率(如选择某一地区某年某人群某疾病的患病率作为标准)️
Ⅱ、计算
→各年龄段预期死亡数=标准人群的年龄别死亡率x实际人群的年龄别人口数️
→标化死亡比(SMR)=实际死亡总数/预期死总亡数️
→标准化率=SMRx标准人群总死亡率
(3)相同之处
(1)原理相同
实质是找一个"标准",使两组得以在一个共同的“平台”上进行比较。
(2)结果的解释相同
标准化后的标准化率,已经不再反映当时当地的实际水平,
它只是表示相互比较的资料间的相对水平。
(3)样本含量较小时,两者的处理方法相同
两样本标准化率是样本值,存在抽样误差。
比较两样本的标准化率,当样本含量较小时,还应作假设检验。
④注意事项
(1)报告结果时,必须说明所选用的"标准"
①选定两组之一,将其作为“标准”。
②两组合并,作为“标准”。
③两组之外另选一个群体,如采用全国、全省或全地区的对象,将其作为“标准”
(2)标准化率仅适用于相互间的比较,实际水平应采用未标化值反映
(3)各年龄组率间若出现明显交叉,宜比较各年龄组死亡率,而不用标准化法
(4)样本标准化率仍然存在抽样误差,对总体进行推断时需要做假设检验。
(5)标准化仅仅用于解决内部构成差异造成的不可比问题。
(6)需要时,可以同时对两个因素(如性别和年龄)作标准化,以作比较。
2、5 总体分布
2.5正态分布
1、一般正态分布
(1)定义
又称高斯分布,是一种很重要的连续型分布。常以x为横坐标,f(x)为纵坐标,绘制正态分布曲线。
若随机变量X服从均数为μ,标准差为σ的正态分布,记为X~N(μ,σ²)。
生活中很常见,例如身高、体重、肺活量等。
(2)概率函数
①意义
X对应的曲线上的点代表概率密度,一个范围如X1~X2内的面积才代表概率
②公式
(3)特点
中间频数最多,两边频数渐少且对称,形成钟形分布。
(4)概率密度曲线
位于横轴上方用于描述概率分布的曲线,该曲线下面积为1,对应概率为1.
某事件在概率密度曲线下对应某一区间的面积即为该事件的概率。
概率密度曲线可看成是直方图一种平滑的近似。
(5)连续型概率分布
①定义
连续型随机变量X是取值范围充满某一数值区间的变量,
即连续型随机变量在忽略测量精度的条件下可以取到该区间中的任意一个值。
X的概率分布由概率密度曲线表示。
某事件的概率可以通过概率密度曲线下对应的面积得到。
②特点
连续型概率分布中某一个具体结果的概率都趋近于0,只有在一个区间内才有概率。
连续型概率分布的概率值不是赋予一个个具体的结果而是充满了某个区间。
2、标准正态分布
(1)定义
①当均数μ=0,标准差σ=1的正态分布,为标准正态分布。
(2)概率函数
(3)标准变换
(1)定义
②任何一个服从正态分布的随机变量可通过Z/U变换使其服从标准正态分布
③经标准变换后的变量Z就是服从标准正态分布N(0,1)的标准正态随机变量,称X的标准化变量或Z分数
(2)公式
Z分数的具体取值记z,即z分数→为变量X与均数之间差值是标准差的多少倍
可用来解决一般正态变量的概率计算
也可用于比较不同正态分布的观测值所对应的概率大小
(4)标准正态分布的68-95-99.7法则
①约68%的可能性X分布在区间(-1,1)之内。
②约95%的可能性X分布在区间(-2,2)之内。
③约99.7%的可能性X分布在区间(-3,3)之内。
(5)将z分数转换为百分位数
①正态分布曲线均数以下所有观测值的概率是50%→(均数为第50百分位数)
②根据68-95-99.7法则
a、距离均数1个标准差范围之内的概率约为68%,均数到均数以上的1个标准差范围的概率约为34%,
b、在均数以上1个标准差的那个值(即z分数为1)就是大约第84百分位数。
c、均数以上2个标准差的那个值就是大约第97.5百分位数。
3、图形特征
(1)曲线形状为单峰、钟形,以均数μ为中心,左右对称;
(2)当X=μ时,正态分布概率密度函数f(x)取值最大,两边减少。
(3)曲线在横轴上方均数μ处最高,μ土σ处有拐点。
(4)曲线尾端与横轴终不相交。
(5)正态分布取决于两个参数,即均数μ和标准差σ
① μ决定曲线位置
当σ一定时,μ越大,曲线越向右移动; μ越小,曲线越向左移动。
②σ决定曲线形状
当μ一 定时,σ越大,表示数据越分散,曲线越“矮胖”;
σ越小,表示数据越集中,曲线越“高瘦”。
(8)正态分布曲线下的面积分布是有规律的
(1)x轴与正态曲线所夹面积等于1或100%。
(2)以直线x=μ为对称轴,X>μ与X <μ范围曲线下面积相等,各占50%。
(3)68—95—99.7法则(3σ准则)
③(μ-σ,μ+σ) 区间的面积为68.3%。
④(μ-1.96σ,μ+1.96σ)区间的面积为95.44%。
⑤(μ-2.58σ,μ+2.58σ)区间的面积为99.74%。
4、实际应用
(1)描述一些实际数据的分布,比如生物的许多特征、测量误差、考试得分等等。
(2)可以很好地近似许多随机事件的结果,比如多次投掷硬币的结果。
(3)正利用正态分布制定这些指标的“医学参考值范围”。
(4)据68-95-99.7法则,可制定相应的质量控制线(x士3s)、警戒线(`x士2s)
(5)建立在正态分布基础上的很多统计推断过程也适用于其他近似对称分布。
(6)有些指标不符合正态分布,但通过适当的变换后可使其近似服从正态分
(7)具有可加性
X~N(μ1, σ²1), Y~N(μ2,σ²2),
若X与Y独立,则X+Y ~N(μ1+μ2,σ²1 +σ²2)。
注意标准差σ,不具有可加性,和为Ö2σ,而非2σ
2.6二项分布
1、定义
将一个“成功”概率为π的伯努利实验独立地重复n次,
令X表示在这n次实验中“成功”出现的次数,X可能取的值是0,1,2,…,n,
根据n次伯努利实验中“成功”总次数等于k的概率计算公式,
得到X的概率分布为
说明n个观察数中恰好发生X个某事件的概率
2、特点
a、二项分布描述的是n次伯努利实验中“成功”次数的分布。
b、随机变量X服从参数为n和π的二项分布,常记作X~B(n,π)。
c、n是人为设定的,π是二项分布的参数,n决定了X的取值范围,n和π决定了X的概率分布。
d、伯努利分布是n=1时的二项分布。
2、性质
(1)X的均数μx=nπ
(2)X的方差σ²x=nπ(1-π)
(3)X的标准差σx=√nπ(1-π)
3、条件
①互斥性
每次试验只能是互斥的两个结果之一
②稳定性
每次试验的条件不变,产生某种结果的概率固定不变。
③独立性
各次试验相互独立
4、图形特征
①n和π是二项分布的两个参数,n决定X的取值范围,n和π决定了X的概率分布。
②图形高峰在μ=nπ处,方差最大为0.25n
③当给定n后
π=0.5时,分布对称;
π<0.5时分布呈正偏态;
π>0.5时分布呈负偏态;
当n值不是很大时,π偏离0.5愈远,分布愈偏
④对于同一个π
随着n的增大,二项分布逐渐逼近正态分布
当n→∞ 时,如果nπ或n(1-π)大于5时,二项分布接近于正态分布。
如π=0.30,n=5和n=10时,图形呈偏态,当n=30时,图形已接近正态分布。
2.7Poisson 分布
1、定义
若离散型随机变量X,其取值为0,1,2,…,相应的概率为
X为单位时间或空间内某事件的发生数,P(X)为事件数为X时的概率,e为自然对数的底
则称该事件的发生服从参数为λ的Poisson分布,记为X~Poisson(λ)。
2、特点
a、是一种离散型分布
b、常用于描述在单位面积、单位时间或单位空间中稀有事件的发生次数的概率分析
c、说明一定观察单位内发生某事件数为X的概率
d、例如单位空间粉尘颗粒数、罕见病、单位容积中的细菌计数、细胞计数。
e、Poisson分布是二项分布的极限形式,二项分布中,当π很小,比如π<0.05,而n很大,二项分布逼近Poisson分布。
3、性质
①属于离散型分布,λ是唯一参数。
②总体方差等于总体均数→λ=μ=σ²。(注意不是标准差 )
③具有可加性(无可乘性,可减性、可除性)
④二项分布在”成功“概率π很小,样本量n趋向于无穷大时,近似Poisson分布。
⑥凡个体具有传染性或聚集性,均不视为二项分布或Poisson分布。
4、条件——与二项分布的使用条件相同
①平稳性
随机事件A发生的次数与观察时间的长短有关,而与观察时间的起点无关。
②独立增量性(无后效性)
在某个观察单位上X的取值与前面各观察单位上X的取值无关。
③普通性
在充分小的时间间隔内,随机事件A最多只发生一次。
5、图形特征
①Poisson分布为正偏态分布,且λ愈小分布愈偏;
②随着λ的增大,分布逐渐趋于对称,当λ=20时已基本接近对称分布;
③当λ≥50时,近似正态分布
2.8三种总体分布的关系
1、区别
①二项分布、Poisson分布
是离散型概率分布,用概率函数描述其分布状况。
②正态分布
是连续型概率分布,用密度函数和分布函数描述其分布状况。
2、联系
①Poisson分布可以视为n很大而π很小的二项分布。
②当n很大,nπ>5且n(1-π)>5 时,二项分布渐近正态分布。
③当μ(λ)≥50时,Poisson分布渐近正态分布。
2.6参考值范围的确定
1、含义
也称正常值范围,
指特定“正常人”人群(排除对所研究指标有影响的疾病和有关因素的特定人群)
的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的某项指标的波动范围。
2、用途
A、个体值的波动范围;
B、绝大多数(如95%)观察对象某项指标的分布范围;
C、医学诊断时判断个体某项指标是否正常.
3、确定原则
①选定足够例数的同质正常人作为研究对象。
②控制检测误差。
③判断是否分组(性别、年龄组)。
④根据医学专业知识确定取单侧或双侧参考值范围
如血铅、发汞太高了不好,取单侧上限界值,参考值范围取上侧部分范围
如肺活量低了不好,取单侧下限值,参考值范围取单下侧部分范围
注意单界值和单侧的定义
⑤综合考虑研究目的、研究指标的性质及数据分布特征选择百分界值。
⑥确定可疑范围。
4、估计方法
(1)正态分布法
(2)百分位数法
(3)对数正态分布法
k为校正值,且k>0
5、制定步骤
根据观察指标的背景和特点,制定抽样的入选标准和排除标准
决定单双侧
(1)过大过小均属于异常。双侧参考值范围,下限≤X≤上限。
(2)过大属于异常。单侧参考值范围,X≤上限。
(3)过小属于异常。单侧参考值范围,X≥上限。
确定范围:95%的参考值范围最为常用
根据样本资料情况选择制定医学参考值范围的方法。
6、与置信区间的区别
①95%的含义不同
置信区间中的95%是可信度,即所求置信区间包含总体参数的可信程度为95%
参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。
②计算公式不同
置信区间——用标准误计算
参考值范围——用标准差计算。
第3章 抽样误差
3、1 抽样分布
1、总体分布
总体中所有个体观测值的分布
分布通常是未知的
常见分布有二项分布、泊松分布、正态分布
2、抽样分布
从同一总体中重复抽取样本量相同的样本,这些统计量的值构成的分布
是统计量的分布规律,统计量会有些什么样的值,以及每个值出现的可能性大小。
常见分布有t分布、X²分布、F分布
3、两大核心定理
1、大数定律️→数量化视角
指在随机试验中每次出现的结果不同,但大量重复试验结果的平均值,总是接近于某个确定的值。
因为在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,
从而使现象的必然规律性显示出来。️
即随着重复试验次数的增多和样本数量的增加,样本均值将趋近于总体均值。
2、中心极限定理→图形展现视角
指给定一个任意分布的总体,每次从这些总体中随机抽取n样本,一共抽取m次,
可以分别计算得到m个样本均值,这些平均值的分布接近正态分布。️
不依赖于总体分布形态,随着重复试验的增多和样本量的增加,样本均值的分布近似于正态分布。
4、样本均数的分布规律
1、概述——中心极限定理
(1)从均数为μ、标准差为σ的正态总体中独立、重复、随机抽取含量为n的样本,样本均数的分布服从均数为μ,标准差为σ`x的正态分布N(μ,σ²`x)
(2)即使从非正态总体(均数为μ、标准差为σ)中独立、重复、随机抽取含量为n的样本,只要样本含量足够大(如n≥50),样本均数也近似服从均数为μ、标准差为σ`x的正态分布N((μ,σ²/n))
2、分布规律
样本均数取值是随机的(对于抽样前而言),样本均数之间存在差异,未必等于总体均数
样本均数总是在总体均数附近随机波动,近似于正态分布,且样本量越大,波动幅度越小
样本均数的标准差与样本量大小、抽样总体的标准差有关
样本均数的变异程度较原始数据的变异程度减小,样本均数较个体观测值更接近正态分布
5、样本率的分布规律
1、概述
从一个总体率为π的总体中随机抽取样本量为n的简单随机样本,样本中“成功”次数(即样本频数)为X,其样本“成功”率(样本率)的抽样分布并不服从二项分布,但样本频数的抽样分布服从二项分布B(n,π)。并且X的均数为nπ,X的标准差为√nπ(1-π),“成功”率p与“成功”次数X间有如下关系:p=X/n,有:p的均数=π;p的标准差=√nπ(1-π)/n
2、分布规律
样本率随机的(对于抽样前而言),样本率之间存在差异,未必等于总体率
样本率的分布服从二项分布,且样本量越大,波动幅度越小
n足够大时,样本率近似服从正态分布
当nπ>5且和n(1-π) >5时,样本率的分布近似服从正态分布N(π,π(1-π)/n)
3.2抽样误差
(1)误差的分类及应对
(1)系统误差
①解释
是某种必然因素所致,不是偶然机遇造尽可能避免,或通过周密的研究设计和成的,具有一定的方向性
②解决办法
调查解决
(2)随机误差
①解释
偶然机遇所致,是不可避免的使用
②解决办法
控制在一定的允许范围内,数据仍可以
(3)抽样误差
①解释
由于个体变异普遍存在,抽样方法优可通过统计方法进行估计,也可通过缺点都有
抽样误差不可避免
②解决办法
增大样本量使其减小
(2)概念和用途
(1)含义
从某总体中随机抽取一个样本进行研究,所得样本统计量与总体参数常不一致
这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。
抽样误差在抽样研究中是不可避免的。
(2)用途
①表示统计量的离散度。
②定量地刻画抽样误差的大小。
③估计统计量的置信区间。
④用于进行假设检验。
(3)来源和表现及其影响因素
(1)来源
①个体变异
②随机抽样
(2)表现
①样本统计量与总体参数间的差异。
②样本统计量间的差异
(3)影响因素
①个体变异(标准差)
②样本量
(7)样本均数的抽样误差及标准误
(1)标准误(SE)
为统计量的标准差
反映抽样引起的统计量与总体参数之间或统计量取值之间的差异
定量刻画了抽样误差的大小。
(2)均数的标准误SEM
①含义
通常把样本均数的标准差称为均数的标准误SEM。
反映的是由抽样引起的样本均数与样本均数之间或样本均数与总体样本间的差异,
反映均数抽样误差的大小
均数的标准误愈小,用样本估计总体均数的可靠性愈好。反之。
②计算方式
①当总体标准差σ已知时
理论值
②当总体标准差σ未知时,常用样本标准差S代替总体标准差
估计值
③变化规律
①当样本含量n固定时,均数的标准误与标准差成正比。
②当标准差固定时,均数的标准误与样本含量n的平方根成反比,即在同一总体中随机抽样,样本含量n越大,抽样误差越小。
③减少均数抽样误差的重要方法是增加样本含量n。
(3)标准差与标准误的区别与联系
①区别
含义
标准差
描述一组变量的离散程度
可以作为总体标准差的点估计。
标准误
描述多个样本均数的离散程度,
并且是样本均数的标准差估计值。
用途
标准差
①刻画个体资料分布的离散程度的指标,标准差越小,个体资料的离散程度就越小,说明变量围绕均值分布越紧密,均数的代表性越好。
②估计医学参考值范围,计算变异系数和标准误
标准误
①表示统计量的离散程度,标准误越小,样本统计量对总体参数的估计可靠性越好,定量刻画抽样误差的大小。
②计算可信区间、进行假设检验
与n的关系
标准差
n⬆,样本标准差随机波动的幅度越来越小,
并且稳定在总体标准差附近(即稳在一个常数附近)
标准误
n⬆,样本均数的标准误越小(即抽样误差越小),并且趋向于0
控制
标准差
个体差异,不能通过统计方法控制
标准误
增大n可减小标准误
②联系
①两者都是变异指标
②在n相同的情况下,标准差越大,标准误相对越大;标准差越小,标准误相对越小
③标准差与标准误成正比,与n成反比
(8)样本率抽样误差及标准误
(1)含义
样本率的标准差称为率的标准误,用于反映率抽样误差的大小
率的标准误愈小,用样本率估计总体率的可靠性愈好;反之
(2)计算方式
①当总体率π已知时
理论值
②当总体率π未知时,常用样本率p代替总体标准差
估计值
3、3常见的抽样分布
3.3 t 分布
1、t分布
1、概念
如正态分布中随机变量X~N (μ,σ²),且进行样本量为n的随机抽样,
当总体标准差σ未知时,可通过样本标准差S估计σ,
但此时样本均数的抽样分布不再服从正态分布,而服从t分布。
统计量`X-μ/S/√n不再服从标准正态分布,而是服从自由度为n=n-1的t分布,记作t~t(n) ,n=n-1
2、图形特征
①为一簇单峰分布曲线,以0为中心(位置),左右对称。
②t 分布的曲线形态取决于自由度n的大小,自由度n越小,则t值越分散,曲线的峰部越矮而尾部越高。
③随着n逐渐增大t分布逐渐接近标准正态分布,当n→∞时,t 分布趋近标准正态分布,标准正态分布可看作t分布的特例。
④与标准正态曲线相比,t分布高峰位置偏低,尾部偏高,n⬆尾部越来越矮,中间越来越高
⑤每一自由度下的t分布曲线都有其自身的分布规律
3、t分布的特征及其稳健性
(1) 根据中心极限定理,从均数为μ,方差为σ²的总体中抽取样本量为n的简单随机样本,当样 本量n很大时,无论总体分布形态如何,样本均数X^仍近似服从正态分布,即`X~N(μ,σ²/n)。
(2)当总体标准差σ未知时,可用样本标准差S估计σ,此时统计量需采用t统计量
4、用途
①对总体均数μ以及两总体均数之差(μ1-μ2)进行统计推断的理论基础。
②回归系数的统计推断。
③相关系数的统计推断。
2、t统计量
1、样本均数的抽样分布、标准正态分布Z~N(0,1)和t分布之间的关系
(1)图形转换
①如图 7-1(A)→7-1(B)
如随机变量X-N(μ,σ²),经正态分布的标准变换后,统计量(X-μ)/σ服从标准正态分布N (0,1)。
②如图7-1(A)→7-1(C)→7-1(B)
从X的总体N(μ,σ²)中进行样本含量为n的多次随机抽样,样本均数`X这一随机变量服从正态分布N(μ,σ²/n),经标准变换后统计量(`X-μ)/σ/√n服从标准正态分布。
③如图 7-1( C)→7-1( D)所示
在实际工作中,当总体标准差σ未知时,常用样本标准差S代替。此时,对正态变量元的不再是标准变换,而是t变换。
统计量(`X-μ)/S/√n不再服从标准正态分布,而是服从自由度为n=n-1的t分布,记作t~t(n)。
(2)t变换公式
(3)t分布和标准正态分布的比较
(1)联系
随着自由度增大,当n→∞时,t分布趋近于标准正态分布。
(2)区别
①t分布为抽样分布,标准正态分布为理论分布。
②t分布比标准正态分布的峰值低,且尾部翘得更高。
③t分布的图形只有自由度n决定,标准正态分布的参数有两个,均数μ和标准差σ。
2、单样本t统计量的稳健性遵循规则
(1)样本量n<15时,数据必须服从正态分布,t统计量才具有稳健性,否则不能用t分布。
(2)样本量15≤n≤40时,除非数据具有异常值或呈强偏态分布,t统计量仍然近似稳健,此时仍可用t分布。
(3) 样本量n>40时,即使数据呈明显的偏态分布,t统计量仍近似稳健,此时仍可用t分布。
(4)当样本量足够大时(n>50)时,分布近似服从正态分布。
3、t界值规律
(1)n一定时,P值越小,t界值绝对值越大
(2) P值一定时,n越大,t界值绝对值越小
(3)相同t界值所对应的双侧概率是单侧概率的两倍
3.4 F 分布
(1)F 分布的概念
如随机变量X₁,和X₂相互独立,分别服从自由度v₁和v₂的X²分布,且X₁~N(μ₁,σ²),X₂~N(μ₂,σ₂),
以样本量n1从总体X₁~N(μ,σ²)中随机抽样,获得样本均数`X₁,及样本方差S²₁
以样本量n₂从总体X₂~N(μ₂,σ²)中随机抽样,获得样本均数`X₂,及样本方差S²₂
重复多次上述抽样过程,获得多个样本方差
两独立正态样本方差之比的F统计量服从F分布
(2)统计量
(3)特点
①F分布是一种连续性分布,只要在给定分子自由度(v₁)和分母自由度(v₂)的条件下,即可求出特定F(v₁,v₂)值对应的函数值,从而可绘制其密度曲线图。
②F分布的分位数
由F分布曲线可以求出从0到某给定F值的面积(概率)。
当v₁和v₂确定后,F分布曲线下右侧尾部的面积为指定α时,横轴上相应的界值F,记做Fα(v₁,v₂),称为F分布的分位数
例如,F0.11(10,40)=1.76,其含义是,在自由度为v₁=10和v₂=40的F分布下随机抽样,抽得的统计量F值中,理论上有90%比1.76小,而有10%比1.76大。
(4)图形特征
(1)F分布为一簇单峰正偏态分布曲线,与两个自由度有关。当两个自由度不等时,若将两个自由度顺序颠倒,得到的是两个不同的F分布,F的取值范围为(0,∞)
(2)若F服从自由度为(v₁,v₂)的F分布,则其倒数1/F服从自由度为(v₂,v₁)的F分布。
(3)自由度为(v₁,v₂)的F分布,其均数为v₂/(v₂-2),与第一自由度无关。
(4)第一自由度v₁=1时,F分布实际上是t分布之平方;第二自由度vz=~时,F分布实际上等于x²分布。
(5)每一对自由度下的F分布曲线下的面积分布规律
3. 5 卡方(X²)分布
(1)概念
设从正态分布N(μ,σ²)中随机抽取含量为n的样本,
样本均数和标准差分别为`X和s,且X²=(n-1)s²/σ²
则X²值服从自由度为n-1的X²分布
(2)特点
①x²分布是方差的抽样分布。
②X²分布还可用于样本分布与理论分布的拟合优度检验、率或构成比的比较等
③可以用X²分布近似描述具有某种属性的实际频数Ai与理论频数Ti之间的抽样误差
④若样本含量和理论频数均较大(如n≥40,Ti≥5),或自由度大于1时,近似程度较好
⑤X²分布是一种连续型随机变量的概率分布,自由度v是其唯一参数,记为X²(α,v)。
⑥X²分布具有可加性
(2)统计量
(3)图形特征
①X²分布为一簇单峰正偏态分布曲线,X²取值范围为(0,∞)
②自由度为v,其均数μ为v,方差σ²为2v
③v=1时X²分布最为偏斜,是标准正态分布变量之平方,随v的逐渐加大,分布趋于对称
④设有k个相互独立的随机变量Z₁,Z₂,…,Zk,其服从均数为0,标准差为1的标准正态分布,则Z²₁,Z²₂,…,Z²k服从自由度为v(v=k)的X²分布,记为X²(v)。
⑤每一自由度下的x²分布曲线都有其自身分布规律,例如X²(0.05.1)=3.84,X²(0.05.2)=5.99
第4章可信区间(定量推断️→给出一个区间(置信区间)
4.1可信区间的概述
1、点估计
1、概念
直接用样本统计量作为总体参数的估计值
2、缺点
未考虑抽样误差
2、区间估计(可信区间)
1、概述
(1)总体均数估计
指用样本均数`X估计总体均数μ,总体均数的估计有点估计和区间估计两种方法。
(2)区间估计
按照一定的概率或可信度(1-α ),用一个区间估计总体参数所在的范围,这个范围称作可信度为(1-α)的可信区间(CI),又称作置信区间。这种方法称为区间估计。
是在点估计的基础上,能给出一个估计范围,提高了估计的准确性,同时通过对区间宽度的控制,提升了估计的精区间估计。
(3)置信区间(CI )
根据样本统计量计算出有(1-α) 把握包含总体参数的一个数值范围,通常记为估计值士误差范围(`x±z'σ/√n)
(5)置信度(C)
①含义
指所用统计方法包含正确答案的概率
即置信区间包含未知总体参数的可能性大小,符号为(1-α)
②特点
在同一样本的情况下,置信度1-α越大,置信区间越宽,
估计总体均数的可信度越高
(6)95%置信度
100次抽样结果的100个95%置信区间中,
平均而言有95个置信区间包含了真实的总体均数。
称为总体均数从的95%置信区间( CI),通常记为估计值土误差范围。
(7)置信区间(CI)️统计推断
将样本统计量和标准误结合起来,确定一个具体较大置信度的包含总体参数的范围
(8)估计值
指对未知总体参数的推测,误差范围与估计值的变异程度有关,反映了估计的准确程度
(9)参数估计
统计推断的种一种,根据从总体中抽取的随机样本来估计总体分布中未知参数的过程
2、可信区间两个要素
1、准确性(又称可靠性)→反映可信度(1-α )的大小
①区间估计的可靠性,1-α 越接近1,越准确。
②常根据研究目的和实际问题的背景由研究者自行决定。
③当抽样误差确定后,可靠性和精确性是相互牵制的
2、精确度(又称精确性)→可信区间的宽度
(1)含义
区间估计的精度,区间越窄精度越高
若要提高可信度,可取较小的α值,但使区间变长,致精密度下降。
一般95%可信区间能较好地兼顾可靠性和精确性。
(2)影响因素
①变异度大小
个体变异越大,区间越宽;
②样本例数
样本含量越小,区间越宽。
③可信度取值
3、置信区间的特点
①置信区间(a,b)中的a与b均由样本数据计算而得
②置信区间包含未知总体参数的可能性可以理解为置信度。
③理论基础是统计量的抽样分布规律。
4、置信区间估计的目的
是描述一个未知参数估计值的准确性以及我们有多大把握认为该结果正确。
任何置信区间均由两个部分组成,由数据计算而得的区间和置信度
可记为估计值土误差范围
5、置信区间的误差范围
(1)含义
(1)当确定了置信度时,误差范围也随之确定。
(2)高置信度(准确性(C)高),较小的误差范围(精确性高)是较为理想的结果
(2)概念理解
由置信度C、正态分布总体标准差σ、样本量n计算而得,m=z'σ/n。
z'可根据置信度C查表可得。C是指在标准正态分布中,土z'之间的概率。
置信区间可记录为`x土m。
(2)减少误差范围的方法
①选择较低的置信度→如果n与σ不变,z'越小误差范围越小
②选择更大的样本量n→当置信度固定时,选择较大的样本量也会减小误差范围
③减小σ→可以通过限定研究总体来减小σ,如只研究总体某个亚群会得到较小的σ
6、置信区间与置信度、样本量、标准差之间的关系
(1)置信度(1-α)
包含总体参数的情况
(1-α)越大, 其对应的界值越大,置信区间越宽。
(2)样本量
①样本量越大,标准误越小,算得的置信区间越窄。
②样本量越大,误差范围越小。
(3)标准差
反映总体的变异程度
在实际应用中,可通过限定研究总体来减小标准差
比如只研究总体的某个亚群,会得到较小的标准差。
7、注意事项
①公式`x±z'σ/n不适用于所有抽样方法,不同的抽样方法需采用不同的均数置信区间估计公式。
②数据须来自相应总体的简单随机抽样,`x±z'σ/n公式使用前提→个体间相互独立
③随意收集且偏倚较大的数据,没有恰当的方法进行统计推断,无法进行统计分析
④样本均数的稳定性不高,易受到异常值影响,需在计算置信区间之前需要找出异常值,并尝试校正或剔除。
⑤如果样本量较小且总体并非正态分布,需在计算前应检查数据是否服从正态分布
⑥当样本量较大时,用样本标准差s估计σ→Z±z's/√n近似估计
⑦实际操作中的问题(如无应答与失访)会给抽样研究带来额外的误差,这些误差可能比随机抽样误差大得多,并且研究结果中这些误差并不能被误差范围所反映
⑧在一次特定抽样与置信区间计算完成后,随机性就不存在了。真实的总体均数只能是在或不在置信区间之间。
8、置信区间意义的解释
①在95%置信区间内有95%的总体参数在该区间?û
②在95%置信区间内,该区间包含了95%的总体参数?û
总体参数有且只有一个
③据样本数据计算出来某个95%置信区间,该区间有95%的可能包含总体参数?û
④总体参数有95%的可能落在该区间û
解释
①一个具体的置信区间估计出来后,它要么包含总体参数,要么不包含总体参数,二者必居其内,无概率可言
②区间的含义为这个区间包含总体参数的可能性是95%。而不是总体参数落在这个区间内次物能性是95%。
③换言之,每抽一次样,就可以获得一个样本统计量,进而求得一个置信区间,每次抽样的置信区间并不完全一致, 而总体参数是一个固定的值,是不会因为抽样而发生变化的,所以只能说置信区间包含到这个总体参数的可能性是多少,而不能说总体参数落在这个区间内的可能性定95%。
⑤所谓95%的可信度是针对置信区间的构建方法而言的。只能说总体参数在该区间内,这个结论正确的可能性是95%。 ü
置信区间是按一定的概率或可信度(1-α),用一个区间来估计总体参数所在的范围
95%的可信度是针对置信区间的构建方法而言的,其表示有95%的把握,真的总体参数在我们所计算出的范围里。
⑥在95%的置信度下,美国年轻人在“全国教育进用展评估”中的平均分数为267.8-276.2,认为所有年轻人中95%的人得分在267.8~276.2之间?û
在95%的置信度下求得的平均分数置信区间表示用样本均数估计所有美国年轻人得分总体均数的误差范围,而不是所有年轻人中95%的人的得分范围。若求95%个体值的波动范围,应计算95%参考值范围。
3、可信区间的正确应用
1、概念理解
①可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。
②所谓95%的可信度是针对可信区间的构建方法而言的
如果重复100次样本含量相同的抽样,每个样本均数按同一方法构建100(1-α )%可信区间,则在这些可信区间中,理论上约有100(1-α )个可信区间包含了总体参数,还有100xα个可信区间未包含总体参数。
以均数的可信区间为例,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按`X±t0.05S`x构建可信区间,则在此100个可信区间中,理论上有95个包含总体均数,而有5个不包含总体均数。
③在区间估计中,总体参数虽未知,但却是固定值,而不是随机变量,且总体参数只有一个
95%的可信区间不能理解为总体参数有95%的可能落在该区间内;
更不能理解为有95%的总体参数在该区间内,而5%的参数不在该区间内。
2、区间μ±u0.05σ`x和`X±t(0.05,v)S`x的区别
(1)μ±u0.05σ`x
①含义
a、从已知的均数为μ标准差为σ的正态分布总体中进行随机抽样,95%的样本均数所在的范围(每100个样本含量为n的样本均数中,理论上有95个被包含在该区间内)
b、从逻辑推理上看,是用演绎法解释了样本均数的抽样误差。
②本质
a、是概率论研究的内容
b、从已知总体中抽样,研究样本均数的抽样误差规律
(2)`X±t(0.05,v)S`x
①含义
a、以样本均数`X估计总体均数μ所在范围,按照95%的可信度估计总体均数所在的范围(若用同样方法估计100次,理论上将有95个可信区间包含总体均数)
b、从逻辑推理上看,是用归纳法解释了样本均数的抽样误差。
②本质
a、是统计学研究的内容(统计推断)
b、根据样本均数和标准误推断总体均数
3、可信区间`X±t0.05,v S`x与容许区间`X±u0.05S的区别
(1)联系
均是从样本估计得到的区间
(2)区别
(1)可信区间`X±t(0.05,v)S`x
1、含义
按预先给定的概率,确定的包含未知总体参数μ(总体均数)的可能范围
2、计算公式→用标准误计算
t分布——总体参数σ未知且n比较小
u/Z分布——总体参数σ已知,或未知但n比较大(如n>50时)
3、与样本量的关系
样本量越大,可信区间越小,n→∞,可信区间n→0
4、应用
总体均数的区间估计(估计总体均数所在范围)
5、95%的含义
为可信度,即所求置信区间包含总体参数的可信程度为95%
6、性质
①用于估计总体参数,总体参数只有一个
②基于的t分布是统计量的抽样分布,一般均可通用
(2)容许区间`X±u0.05S
1、含义
指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的人群)的剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。
2、计算公式→用标准差计算
3、与样本量的关系
样本量越大,参考值范围越稳定
4、应用
①个体值的波动范围
②绝大多数(如95%)观察对象某项指标的分布范围
③医学诊断时判断个体某项指标是否正常
5、95%的含义
是一个比例,即所求参考值范围包含了95%的正常人
6、性质
①用于估计变量值的分布范围,变量值可能很多甚至无限;
②基于的正态分布是变量值的分布,只有当变量值的分布接近正态分布时方才适用
4.2均数和方差的可信区间——定量资料
1、均数的可信区间
1、单个总体均数
1、单样本情形
(1)t分布
①总体参数σ未知且n比较小
(2)u/Z分布——总体参数σ已知或未知,但n比较大(例如n>100)
2、配对设计的情形
其中,自由度v=n-1,n为对子数。
要求样本差值数据d,d₂,…,dn服从正态分布
或样本量(即对子数)n足够大,以确保样本差值均数`d服从或近似服从正态分布。
2、两个总体均数之差
(1)t分布——样本含量较小时
(一)两总体方差相等情形
(二)两总体方差不等情形
(2)u/Z分布——样本含量较大时((n1,n2均大于50))
2、方差的可信区间
从正态分布N(μ,σ²)中随机抽取含量为n的样本,样本的均数和标准差分别为X和s
4.3率和事件数的可信区间——定性资料
1、率的可信区间
1、总体率π
1、精确概率法(查表法)→n较小(≤50),P接近0或1,即nP和n(1-P)≤5
(1)公式
πr和πu中分别对应两个不同的F分布
Fα/2;2(n-r+1),2r是自由度为[2(n-r+1),2r]的右侧概率为r/2的F分布分位数
Fα/2;2(r+1),2(n-r)是自由度为(2(r+1),2(n-r))的右侧概率为α/2的F分布分位数
(2)当n≤50时也可以查附表6“百分率的可信区间”直接获得95%或99%的可信区间
①正态近似法
2、正态近似法→n较大,P和1-P均不大小,即nP和n(1-P)>5
式中p为样本率,π0为给定总体率(常为理论值或标准值),n为样本含量。
3、校正样本率的正态近似法→样本量不大或nπ或n(1-π)不太大时
对样本率p实施“分子+2,分母+4”的校正→也称为“+4估计方法”
2、两总体率之差π₁一π₂
①正态近似法
1、正态近似法→样本含量n₁、n₂足够大,且n₁p₁,n₁(1-p₁),n₂p₂,n₂(1-p₂)均大于5
2、校正样本率的正态近似法→P₁、P₁(1-p₁)、p₂、P₂(1-p₂)不太大,或样本量较小时
可对样本率实施“分子+2,分母+4”校正
2、事件数的可信区间→Poisson总体平均计数u
1、正态近似法→样本计数X>50时
①
②
2、查表法(直接计算概率法)→样本计数X≤50时
X=0时,λL=0
第5章 假设检验(️定性推断️→给出一个结论(是否拒绝H₀)
5.1假设检验概述
1、含义
统计推断的一种,用来判断样本与样本、样本与总体的差异,
是由抽样误差引起还是本质差别造成的统计推断方法。
基本原理是先对总体的特征做出某种假设,
然后通过样本数据进行统计推理,对此假设应该被拒绝还是接受做出推断。
2、假设检验的目的及意义
(1)目的
判断样本与样本、样本与总体之间的差异,
是由抽样误差(差异没有统计学意义)引起的,
还是有本质差别(差异有统计学意义)造成的统计推断方法
(2)意义
①分辨两个样本是否分别属于两个不同的总体,并对总体作出适当的结论。
②分辨一个样本是否属于某特定总体等
3、分类
(1)参数检验
在总体分布形式已知的情况下,
对总体分布的参数如均值、方差等进行推断的方法。
因在推断过程中涉及到有关总体分布的参数(如μ、σ),又称为“参数"检验。
(2)非参数检验
在总体分布未知或知之甚少的情况下,
利用样本数据对总体分布形态等进行推断的方法。
因在推断过程中不涉及有关总体分布的参数(如μ、σ),又称为“非参数”检验。
4、注意
①假设检验中的假设
是指我们对总体特征(如参数、分布)的某种推测,
用概率来判断样本数据所提供的信息与我们对总体特征猜想的一致性,
进而结合专业知识判断这一猜想的正确性。
②假设检验中的概率
是在假设两个总体均数没有差异的前提下,利用样本数据计算得到的。
③假设检验中得出的结论
①对假设结论的两种解释
①我们的假设正确️两个总体均值之间没有差异(十分罕见)
②我们的假设不正确
②若所得出的结论,没有否定假设,但并不能说明假设一定成立,只能说明根据抽样数据所计算出来的概率没有达到事先规定的小概率事件(检验水准)
5.2假设检验的思路
(1)假设的3个关键点
①都是从总体均数是否存在差异开始的
②都是用样本均数差值与假设总体均数相差为0(即两个总体均数没有差异)进行比较
③都是用概率来表示比较的结果
(2)假设检验的思路
①比较样本信息与总体参数的一致程度。
②以确立的假设总体为依据,求出从中获得手头样本(含与总体参数偏离更大的样本)的概率,通过对此概率的界定作出结论
③核心思想
①小概率思想
指小概率事件(一般指概率≤0.05)在一次实验中基本上不会发生;
②反证法思想
先提出待检验的假设,如果样本信息不支持该假设,就拒绝该假设。
5.3假设检验的步骤
建立检验假设
(1)建立假设检验
(1)零假设H₀→目前的差异是由抽样误差引起的
①含义
亦称为原假设或者无效假设设
H₀:两个总体均数无差异,即μd=0。通常表述为“没有差异”或“无效”。
②意义
α、如果没有被拒绝,则意味着样本信息没有提供足够的证据拒绝H₀;
b、如果H₀被拒绝,则说明样本信息不支持H₀。
c、零假设是在我们没有证明某现象之前作出的保守推测。
(2)备择假设H₁→目前的差异是由本质不同造成的
①含义
如果H₀被拒绝,从逻辑上讲,更有利于另外一个与零假设有联系且相互对立的“假设”,通常称其为“备择假设”
H₁:两个总体均数有差异,即μd≠0。
②意义
α、当H₀被拒绝时采用
b、在现实研究中,H₁描述的往往是我们希望看到的结果,但正确描述H₁,较困难
(2)常见假设形式
(1)比较两个均数之大小
H₀:μ₁=μ₂,即两个总体均数相等
H₁:μ₁≠μ₂,即两个总体均数不等
(2)比较多个均数之大小
H₀:μ₁=μ₂=μ₃……
H₁:μ₁、μ₂、μ₃……之间不等或不全等
(3)与特定的H₀比较
H₀:μ=0,即总体差值均数为0,“血脂在治疗前后无差异”
H₁:μ≠0,表示治疗前后有差异
确定检验水准α
(1)含义
是人为规定的,表示拒绝实际上成立的H₀的最大允许概率,
通常取0. 05,表示我们根据样本信息错误拒绝H₀的概率不超过5%
(2)注意
α、双侧检验较单侧保守,单侧检验比双侧检验更容易获得拒绝H₀的结论
b、拒绝实际上成立的H₀的最大允许概率=小概率事件的最大概率=犯一类错误的最大概率
(3)α水准在假设检验结论中的意义
①α水准说明按不超越多大的误差为条件作结论
②采用更小的α水准,当P值<α时,只说明所作结论的误差更小,冒的风险更小而已
检验统计量的选择与计算
①定义
在H₀成立的前提下计算出来
衡量样本与已知总体间的差别或偏离程度的一个统计指标
②涵义解释
①对估计值与假设检验值之间的差异进行标准化转换,从而评估总体参数之间是否存在差异
②通常情况下,在两组均数的差异性检验中,检验统计量的计算形式如下:Z=估计值-假设检验值/估计值的标准误(即样本的抽样误差)
③如果比值较大,表明样本抽样误差不足以解释总体参数估计值与假设检验值差异的原因,推断总体参数与假设检验值存在差异,因而拒绝H₀。
④如果比值较小,表明总体参数估计值与假设检验值的差异在样本抽样误差可以解释的范围内,不能推断总体参数与假设检验值存在差异,因而不拒绝H₀。
③不同资料的检验统计量
α、如连续型变量,独立两样本,符合正态、方差齐,用t检验或方差分析
b、涉及计算样本率等,用卡方检验
c、等级资料或分布类型不明确,用秩和检验
计算P值,作出统计推断
(1)P值含义
在H₀成立的条件下,计算现有样本统计量以及更极端情况的概率,称为假设检验的P值
通过检验统计量计算出P值后,与事先确定的检验水准α值进行比较,即可得出假设检验结论。
(2)统计推断结论
①若P≤α
α、按照α水准,拒绝H₀,接受H₁,可认为总体参数之间的差异有统计学意义
b、差异有统计学意义,表明两总体确有差别→两样本差别有统计学意义)
②若P>α
α、按照α水准,不能拒绝H₀,尚不能认为总体参数之间的差异有统计学意义
d、差异无统计学意义,因为随机误差不具有代表性,很有可能再一次抽样中发生,由抽样误差引起的。
(3)检验水准α与P值的比较
(1)区别
①检验水准α的含义
在假设检验之前设定的,说明按不超过多大的误差为条件作结论,
是犯I类错误的最大风险。
②p值的含义
在假设H₀成立的条件下,从H₀所规定的总体中随机抽样,
所观察到现有情况及比现有情况更极端(越背离H₀)情况出现的概率。
即样本均数与总体均数、样本均数与样本均数之间的差异,用抽样误差解释的可能性有多大。
③一个样本按某一检验方法只能得出一个P值,但供研究者用来界定此P值的α水准却可有多个。
(2)联系
①假设检验得出的P值要与检验水准α比较来判断,在假设H₀成立的条件下,差异用抽样误差解释的可能性大小是否为小概率事件。
②当P<α=0.05时,说明在H₀成立的条件下,得到现有检验结果的概率小于给定的小概率事件标准0.05。因为小概率事件在一次事件中几乎不可能发生,现在确实发生了,说明现有的样本信息不支持H₀,所以怀疑原假设H₀不成立,故拒绝H₀
③在下“有差别”结论时,知可能犯I类错误的概率不会大于0.05,在概率上有了保证
5.4假设检验的正确应用
5.4.1、假设检验实施的前提
(1)确认指标或数据分布的意义
(2)确认样本的随机性
5.4.2正确理解P值
①P值标明以多大的误差拒绝H₀,即作出“拒绝H₀,接受H₁”的结论时冒了P风险
②P值小,风险小,认可此结论的误差也小;P值大,风险大,难以认可此结论。
③P值不会为0,故此结论不可能没有误差或不冒风险。
5.4.3、Significαnt的本义
①表示“有意义的”、“非偶然的”,常用于假设检验的结论中。
②“显著性”和“显著的”并非原词本义。
5.4.4、假设检验结果的表述
①假设检验的结论不能绝对化
①理由一
假设检验的结论是根据P值大小和检验水准α做出的,存在犯错误的风险。
拒绝H₀, 可能犯I类错误。接受H₀,可能犯II类错误。
②理由二
是否拒绝H₀,不仅取决于被研究事物有无本质差异,
还取决于抽样误差大小、检验水准α的大小以及单侧、双侧检验等。
③举例
如同一检验水准α,随着样本量n的增加,
由于抽样误差的减小,结论有可能从不拒绝H₀到拒绝H₀。
因此,下统计学结论时要慎重,不能绝对化,假设检验本身并无此寓意。
②当P>α 时,虽不拒绝H₀,但也不能推断H₀成立(接受H₀)
①理由一
α、假设检验是基于反证法和小概率的思想
b、当H₀为真时
①拒绝H₀
当样本统计量出现在小概率事件范围内,可以推断两样本确实有差别,拒绝H₀。
假设检验中P≤α原本只表达接受H₁有统计学意义,
出现H₁的结果是“非偶然的”,即研究结果并非由抽样误差所偶然获得;
②不拒绝H₀
当样本统计量未出现在小概率事件范围内,只能说尚未发现有足够的证据拒绝H₀
比如H₀:μ=0,H₀:μ=0.01,H₀:μ=0.013,中H₀可能均未被拒绝,较难选择接受哪一个。一般只说“不拒绝”,而不说“接受”,逻辑上比较严谨
②理由二
a、正如反证法,只是寻找推翻假设的证据,并不是寻找支持假设的证据,推翻假设的证据,并不能成为证实假设成立的证据
b、对于两总体均数相同(即H₀),这一结论无任何概率保证
③理由三
a、事实上,不拒绝H₀时,犯II类错误的概率p有时还很大,并且无法由研究者直接控制,所以不拒绝H₀时,不能直接推断H₀成立。
b、当P值不太小,拒绝的理由不充分时,并不等于这个假设的成立。
③两总体参数要么相同要么不同,差异是否有统计学意义是指两样本之间的差异
5.4.5、使用假设检验时应注意
①选择合适的检验水准
②统计学意义并不意味着具有实际的专业意义
③不要忽略无统计学意义的结果
④统计推断并非对所有数据有效
⑤谨慎追求统计学意义
5.5假设检验的几个相关问题
一、检验效能
(1)假设检验本质上
是一个决策的过程,要么拒绝H₀,要么不拒绝H₀;
这两种情况都有可能发生,但其可能正确也可能不正确。
(2)假设检验的两种可能
①若H₀成立,不拒绝H₀时→检验水准α的意义——防止过多拒绝真实的H₀
②若H₁成立,拒绝H₀的能力→检验效能的意义——尽量拒绝错误的H₁
提高正确决策的能力
(3)检验效能的概念
又称把握度,用1-β表示概率的大小。
指当H₁为真时,两总体确实有差别,按α检验水准能够发现它们有差别的能力,
即假设检验能够拒绝H₀的概率,称为能发现该H₁的检验效能。
通常取值不宜低于0.80。
(3)计算检验效能包含以下三步
(1)图形推断
(2)步骤
①确定H₀、H₁(备择假设,希望检测到的效应)以及检验水准α。
②找到能拒绝H₀的样本均数`X的取值范围(也被称为拒绝域)→Z=`X-μ/σ/Ön
③计算H₁为真时样本均数位于拒绝域的概率,即发现该H,的检验效能。
(4)检验效能的影响因素
①检验水准α→如α减小
图6-10(A)中的临界值向右移动,
图6-10(B)临界值右侧的面积更小→检验效能更小
②H₀与H₁的差异大小(`X距μ的距离)→差异增加
图6-10(B)的概率分布整体向右移动,
得到更大的检验效能
③样本量→n增大
图6-10(B)的离散程度减小
增加图6-10(B)临界值右侧面积
得到更大的检验效能;
④标准差σ→减小
图6-10(B)的离散程度减小
增加图6-10(B)临界值右侧面积,
得到更大的检验效能
临界值不变
二、基于决策的推断与两类错误
1、基于决策的推断
1、假设检验中的推断
①意义
假设检验作为评价拒绝H₀证据强弱的方法,其评价依据为P值。
H₀在其中具有特殊地位,即寻找证据拒绝它,
H₁(研究者希望得到的)本身对是否拒绝H₀没有任何影响,只能拒绝H₀,接受H₁
②本质
假设检验的结论不可能接受H₀,
不存在“H₀本身不成立,而假设检验的结论认为其成立”这种情况。
若检验结论错误,只可能是“H₀本身成立而假设检验的结论认为其不成立”这种错误
③决策标准
即检验水准,也称为显著性水平,用α表示,
用来表示“H₀为假”这一样本结果极不可能发生的概率值。
2、基于决策的两种推断
接受H₀或接受H₁,必须在二者中接受其一,H₀与H₁的地位对等。
每一次决策仅可能犯一种错误。
2、两类错误
1、概念
第一类错误——“弃真”
当H₀为真实时,而决策结论认为其不成立,即当H₀为真,拒绝H₀,接受H₁
出现第一类错误的概率,称第一类错误率,用符号α表示。
第二类错误——“存伪“,
当H₁为真实时,而决策结论认为其不成立,即当H₁为真,接受H₀,拒绝H₁
出现错误的概率,称第二类错误率,用符号β表示。
2、注意事项
无论拒绝或不拒绝原假设,都有犯错误的可能性
当拒绝H₀时,只可能犯一类错误,不可能犯二类错误
当不拒绝H₀时,只可能犯二类错误,不可能犯一类错误
3、计算步骤
(1) 候选决策
①确定H₀=μ₀、H₁-=μ₁
②确定检验水准α,常取0.05
③确定单双侧
(2) 决策规则
①计算步骤
①找到能拒绝H₀的样本均数`X的取值范围(也称拒绝域)
②在α=0.05下,`样本均数`X与μ₀的差异有统计学意义,等价于Z统计量的绝对值大于等于1.96。|Z=`X-μ/σ/Ön|≥1.96
②根据样本均数`X的取值范围作出两种决策
②`X≤X₁,或`X≥X₂,当H₀为真时
拒绝H₀,接受H₁,差异有统计学意义,
表明两总体确有差别→两样本差别有统计学意义)
此时,犯第一类错误α
①X₁≤`X≤X₂,当H₁为真时
拒绝H₁,接受H₀,差异无统计学意义
两总体之间的差异,可能由抽样误差引起的。
此时,犯第二类错误β
(3)基于决策规则的第I类错误的概率
通过设置第I类错误的概率为0.05而得到的
(4)基于决策规则的第II类错误的概率
第Ⅱ类错误为样本数据的`X满足X₁≤`X≤X₂,从而接受H₀,
其概率为Pr(X₁≤`X≤X₂)|H:μ=μ₁)=Pr(X₁-μ₁/σ/Ön≤Z=`X-μ/σ/Ön≤X₂-μ₁/σ/Ön)
(5)检验效能
等于1减去犯第Ⅱ类错误的概率。
三、两类错误及检验效能三者之间的关系
(1)定义
①检验水准和第I类错误
检验水准α就是犯第I类错误的概率。
即当H₀为真时,假设检验拒绝H₀(接受H₁)所犯的错误。
②检验效能和第II类错误
①第II类错误
当H₁为真时接受H₀(拒绝H₁)所犯的错误。
常用β表示犯第II类错误的概率,
②检验效能
固定检验水准下,其检验效能为1减去犯第II类错误的概率。
常用1-β表示检验效能。
(2)三者的关系
①检验效能(1-β)
固定检验水准下的检验效能就是1减犯第II类错误的概率,即检验效能为1-β。
②α和β是反向变化的
当样本量定时,α越小,β越大;反之亦然。
要同时减少α及β,唯一的方法是增加样本例数
③根据研究要求适当控制
若想同时减少α和β,只有增大样本含量。
若重点减少α,可取α=0.01;
若重点减少β,可取α=0.05,α也可以取其他水准。
④第I类错误α
根据研究者要求确定(0.05或0.01)。
⑤第II类错误β
只有与H₁结合才有意义,β值很难确切估计。
可用于评价决策过程正确的可能性
四、假设检验和基于决策的推断区别与联系
1、区别
(1)假设检验
①关注单 一假设(H₀)
②只关注单一概率(P值)
③目的
是衡量拒绝H₀的样本证据的强弱。
如果不能拒绝H₀,我们的结论仅仅是尚无充分证据证明H₀是错误的,而不是为真。
(2)基于决策的推断
①关注两种假设(H₀与H₁)。
②必须同时关注两类错误的概率,且控制两类错误的概率处于同等重要的地位。
③目的
是基于样本证据给出在两种假设中做抉择的依据,
必须选择其中一个假设,并且不能以证据不足为由放弃选择。
2、联系
①使用假设检验的H₀和H₁术语。
②考虑实际问题时使用基于决策的推断思维,从而可使用第I类错误和第II类错误的概念
③第I类错误的概念更加严谨。选择了α(检验 水准)后假设检验的第I类错误概率不会大于α。
④基于第③点产生的所有可能检验规则,从中选择 一个使得β尽可能小的检验
5.6假设检验之差异检验与优度检验
1、差异检验
(1)意义
在于是否能够确认H₁成立,希望得到很小的P值,因为P值越小,
表示手头样本从H₀总体随机获得之概率越小,即否定H₀,确认H₁成立的把握越大。
被确认的H₁为μ₁≠μ₂或μ₁>μ₂等,反映μ₁与μ₂存在差异,称差异检验。
(2)特点
“差异存在”
(3)确定检验水准
通常确定一个小值为检验水准,如α=0.05,
只要所得P≤α,即可拒绝H₀,而接受H₁,并作结论。
(4)类别
在临床试验中,常用的优效检验一般属于差异检验。
“优效”并不一定指H₁:μ₁>μ₂,而是指H₁:μ₁-μ₂≥δ,即要求μ₁超过μ₂达到δ或以上方可认为二者疗效有差异;
(5)差异性检验的分析方法比较
(6)有关差异性的概念辨析
(1)总体均数 VS 样本均数 VS 差异有统计学有意义
提出研究问题时
正确提法
两总体均数是否相等
错误提法
①两样本均数是否有差异
②两总体均数差异是否有统计学意义
建立检验假设时
正确H0——两总体均数相等
错误H0——两样本均数相等
统计推断做出结论时
正确结论
P≤0.05
①两样本均数差异有统计学意义
②可以认为两总体均数不等
P>0.05
①两样本均数差异无统计学意义
②尚不能认为两总体均数不等
错误结论
P≤0.05——两总体均数差异有统计学意义
P>0.05——两总体均数差异无统计学意义
(2)两样本均数 VS 差异有统计学有意义 VS 总体均数不等
差异有统计学有意义≠实际的两个总体均数不等(存在犯一类错误的可能)
(3)差异有统计学有意义 VS 差异有实际意义
差异有统计学有意义≠差异有实际意义
差异有实际意义≠差异有统计学有意义
2、优度检验
(1)意义
在于是否能够确认H₀成立,希望得到的P值较大,因为P值越大,
表示手头样本从H₀总体随机获得之概率越大。
即可认为手头样本是H₀总体的一个随机样本,
样本统计量与总体参数的差异属于抽样误差,
样本统计量与总体参数是接近的,称优度检验。
检验某样本获自所拟合总体之优度——拟合优度。
(2)特点
突出“差异很小”,甚至可以被忽略不计。
(3)确定检验水准
为了使优度检验之结果具有较好的稳定性,应该选取较大的值作为检验水准
一般用α=0.20水准,或0.30、0.50等,慎用α=0.10水准。
(4)类别
在临床试验中,常用的等效检验一般属于优度检验。
“等效”也不一定指μ₁=μ₂,而是指|μ₁=μ₂|<δ,这里δ>0。
5.7、可信区间与假设检验的区别及联系
1、区别
(1)置信区间估计
①用于推断总体参数所在的范围;
②本质
以样本资料估计总体参数的真值。
大概率为标准
通常以较大的把据程度(置信水平) 1-α去保证总体参数的置信区间。
③可以提供假设检验没有提供的东西
①图形展示
如图,置信区间(a)~(c)均不包含原假设H₀,差异有统计学意义
置信区间(d)与(e)均无统计学意义,
②置信区间提供的信息
(a)提示差异具有实际意义;
(b)提示可能具有实际意义;
(c)提示实际意义不大;
(d)提示可能样本量不足,
(e)属于尚不能拒绝零假设的情况。
④在回答有无统计学意义时,还可以提示差别是否具有实际意义
⑤可以回答假设检验的问题
a、对于同一样本数据,若假设检验的结果是P≤α,则按照相应置信度的可信区间必定不包括H₀所定的总体参数,反之亦然。
b、1.96→95%法则
落在之内,在置信区间内;
之外️小概率事件或拒绝域。
(2)假设检验
①用于推断总体参数之间是否不同。
②本质
以样本资料检验对总体参数的先验假设是否成立
以小概率原理为标准
③比置信区间提供更多的信息,通常是给定很小的显著性水平α去检验对总体参数的先前假设是否成立或对总体的分布的形式的假设进行判断。
④可报告确切的P值,而可信区间只能在预先确定的置信度100(1-α)%水平上进行推断
2、联系
(1)假设检验与置信区间估计都属于统计推断方法,
(2)通常情况下,置信区间估计总体参数的统计量与假设检验的检验统计量相同。
(3)两者相辅相成,相互结合起来可以提供更为全面的统计推断信息
(4)结论的涵义是一致的,基础都是抽样误差理论。
三、统计分析
(一)三类资料的差异检验——单变量分析
第6章 定量资料的分析
一、单个样本与给定总体均数的比较
(一)t检验的概述
(1)定义
主要用于样本含量较小,总体标准差σ未知的正态分布资料的假设检验,
在做两样本均数比较时,要求两样本对应的总体方差相等。从而作出统计推断。
包括单样本t检验、两独立样本t检验、配对设计资料检验等。
(2)不同情形下的t检验
(3)与z检验的区别与联系
(4)t检验的类型
(1)单样本t检验
①目的
检验样本均数`x所代表的总本均数μ,是否与某给定μ₀存在差异。
②适用条件
服从正态分布
③假设检验的公式
(2)两独立样本t检验
①目的
检验两样本均数所代表的总体均数是否相等
②适用条件
独立、正态、方差齐
③假设检验的公式
S²c=
(3)配对设计资料检验
①目的
检验样本均数d所代表的未知总体均数μ。是否等于0
②适用条件
①配对的两个受试对象分别接受处理之后的数据
②同一样品两种方法(或仪器等)检验的结果
③同一受试对象两个部位的数据
④同一受试对象干预前后的配对
③假设检验的公式
(二)单样本的情形→总体均数t检验
1、推断的基本任务
①估计总体均数μ的1-α置信区间。
②检验样本均数`x所代表的总本均数μ,是否与某给定μ₀存在差异。
2、含义解释
①已知总休均数μ₀,一般指理论值、标准值或经过大量观察所得到的稳定值。
②观测到的样本均数`x从未知总体中随机抽取,是随机变量`X的某次具体取值
3、适用条件
①样本数据来源于正态分布,
②或者即使样本数据不服从正态分布, 但样本量足够大(一般需大于40) ;
③当样本量足够大(如n>50)时,t分布近似服从正态分布
4、检验步骤
建立检验假设,确定检验水准
建立检验假设
H₀:μ=μ₀,样本均数代表的未知总体均数μ与给定μ₀相同
H₁:μ≠μ₀,样本均数代表的未知总体均数μ与给定μ₀有差别
检验水准α=0.05
计算检验统计量t值
①服从正态分布
单样本t检验
②不服从正态分布
①变量可经某种变量转换满足正态性
②二项分布检验
Z检验
n较大,P不太接近0或1,即nP和n(1-P)>5
直接计算概率法
n较小,P接近0或1,即nP和n(1-P)≤5
基本思想
根据中位数的意义可知,变量X≥中位数的概率π为0.5,同样变量X≤中位数的概率π也为0.5。
若样本所来自的总体之中位数=已知常数,则总体中随机抽样所得的观察值大于已知常数θ₀的概率π应当等于0.5。
故检验总体中位数是否等于已知常数,即检验样本中观察值大于已知常数θ的频率p与0.50间的差异是否由抽样误差所造成。
如果nπ₀(1-π₀)>5,则满足单样本的样本率近似正态分布的条件,
检验统计量为
当H₀:π=π₀=0.5成立时,Z近似服从于标准正态分布,可以按照标准正态分布的界值下结论。如果nπ₀(1-π₀)≤5,则应使用确切概率法直接计算P值,与检验水准a比较,作出统计推断。
③Wilcoxo秩和检验——资料是对称或近似对称分布
确定P值,作出统计推断
①若P≤α,按照α水准,拒绝H0,接受H1,样本均数代表的未知总体均数μ与给定μ₀的差异有统计学意义。
②若P>α,按照α水准,不能拒绝H0,样本均数代表的未知总体均数μ与给定μ₀的差异无有统计学意义。
5、单样本定量资料与总体比较的流程图
(三)非正态数据的情形
①非参数统计方法
②蒙特卡罗模拟参数推断方法。
③数据转换方法
①含义
将原始数据转化为正态分布数据
②目的
对总体的正态性有所改善
③常用的数据变换的方式
①对数变换
适用于对数正态资料;
标准差和均数成比例。
②平方根变换
方差和均数成比例
如Poisson分布。
③平方根反正弦变换
百分比资料
二、两样本的比较
(一)两独立样本均数→完全随机设计
1、概述
1、完全随机设计
(1)定义
将同质的实验对象随机地分配到研究因素各水平对应的处理组,进行处理并观察,
或从不同特征的总体中随机抽样,并对样本进行对比观察的设计方法,称为完全随机设计,又称成组设计。
(2)分析方法的选择
①定量资料
①若满足独立性、正态性和方差齐性的要求
可根据组数选择两样本均数比较的t检验
或单因素方差分析
②若样本含量不太小,样本所来自的总体略微偏离正态
t检验和方差分析仍然是稳健的
③若总体分布极度偏离正态,或各组总体方差不等
需酌情采用变量变换达到正态化和方差齐性后再进行分析,
或采用非参数统计学方法,如Wilcoxon成组秩和检验、Kruskal-Wallis H检验等
②对于等级资料
两组间的比较可采用Wilcoxon成组秩和检验,
多组间比较使用Kruskal-Wallis H检验。
③对于定性资料
可用R×C表来描述,并用X²检验来进行组间比较,必要时采用确切概率法。
(3)实验设计的方法辨析
①单处理因素设计
a、若只安排一种处理因素,不安排任何配伍因素,则为完全随机设计;
b、若安排一种配伍因素,为随机区组设计;
c、若安排两种配伍因素,为拉丁方设计。
②多处理因素设计
多处理因素设计一般安排两种或两种以上处理因素,
如析因设计、正交设计、裂区设计等
2、两样本总体均数推断的基本任务
①估计两个总体均数之差(μd=μ₁-μ₂)的1-α置信区间;
②检验两样本均数x₁和x₂所代表的总体均数μ₁和μ₂是否相等(即H₀:μ₁=μ₂是否成立)。
3、进行两独立样本t检验的前提条件
(1)独立性
①概念
即任何两个观察值之间互不影响
②检验
由抽样方式决定
(2)正态性
①概念
即要求两样本分别来自正态分布的总体或样本量足够大
②正态性检验
①检验假设
H0:资料服从正态分布;
H1:资料不服从正态分布
②检验水准
α=0.05
③检验方法
Shapiro-Wilk正态性检验、
偏度和峰度联合检验
④注意事项
对于两组资料,是分别进行正态性检验
(3)方差齐性
①概念
即两样本的总体方差相等
②方差齐性检验
①检验假设
H0:两总体方差相等;
H1:两总体方差不等
②检验水准
:α=0.10
③检验方法
F检验
4、两样本均数之差的抽样分布
1、图形抽样过程展示
2、图形转化过程
(1)如图7-2(C)所示
(1)由于变量X₁与X₂相互独立且均服从正态分布,
其样本均数`X,和`X₂仍服从正态分布,
根据数理统计中服从正态分布的两独立变量加减后仍然服从正态分布的原理,
统计量(`X₁-`X₂)服从如图7-2(C)所示的正态分布,
即(`X₁-`X₂)~N(μ₁-u₂,σ²`x₁-`x₂);
其中σ²`x₁-`x₂=σ²₁/n₁+σ²₂/n₂,为两均数差值的总体方差。
(2)如图7-2(C)→7-2(D)所示
将服从正态分布的统计量(`X₁-`X₂)作标准变换后,
统计量(`X₁-`X₂)-(μ₁-u₂)/σ²`x₁-`x₂服从标准正态分布。
(3)如图7-2(C)→7-2(E)所示
实际工作中由于总体标准差σ₁和σ₂常常未知,
常用其相应的样本标准差S₁和S₂代替而得到两样本均数差的样本标准差S`x₁-`x₂
此时,统计量(`X₁-`X₂)-(μ₁-u₂)/S`x₁-`x₂不再服从标准正态分布,而是服从t分布
3、两样本t统计量的稳健性
①样本量n₁+n₂<15时,两样本需来自正态分布总体,统计量t才具有稳健性;否则,不能用t分布。
②样本量15≤n₁+n₂≤40时,除非样本数据具有离群值或呈强偏态分布,统计量t仍近似稳健,仍可用t分布。
③样本量n₁+n₂>40时,即使样本数据呈明显的偏态分布,统计量t仍较稳健,仍可用t分布。
④在实际过程中,两样本均数差值的t统计量要比单样本均数的t统计量更稳健。
⑤蒙特卡罗模拟证明
a、当两样本相等(n₁=n₂),且两总体分布形状相似时,即使样本量不大,t统计量仍服从t分布。
b、当两总体分布形状明显不同时,只要样本量足够大,t统计量仍服从t分布。
5、两样本比较的目的
推断其所代表的总体的参数是否不同,
通常需推断两总体均数是否相等或两总体方差是否不等,
而后者通常是前者的前提条件,
即在进行两样本均数比较的t检验时,要求两样本来自方差相等的两个总体。
2、假设检验
(一)两个总体均数的假设检验→成组t检验、t'检验
2、服从正态分布→成组t检验、t'检验
建立检验假设,确定检验水准
建立检验假设
H₀:μ₁=μ₂,两样本的总体均数相同;
H:μ₁≠μ₂,两样本的总体均数不相同
检验水准α=0.05
计算检验统计量t值
1、两总体方差相等(σ²₁=σ²₂)时→成组t检验
①成组t检验
当两总体方差相等时,通常采用两独立样本均数比较的t检验,又称成组t检验
它适用于完全随机设计两独立样本均数的比较。
②公式
2、两总体方差不等(σ²₁≠σ²₂)时→t'检验
确定P值,作出统计推断
①若P≤α,按照α水准,拒绝H0,接受H1,两总体均数不同,差异有统计学意义。(两总体确有差别;两样本差别有统计学意义)。
②若P>α,按照α水准,不能拒绝H0,两总体均数相同,差异无有统计学意义。
(二)两总体方差的假设检验→齐性检验(F检验)
(1)F检验含义
判断两总体方差σ²₁与σ²₂的齐性等价于检验H₀:σ²₁=σ²₂是否成立,
由两样本方差之比的抽样分布原理及F分布可知,
在H₀成立的前提下,有S²₁/S²₂~F(n₁,n₂)。
且对应的t²服从F(1~n-1),t²=F。
(2)检验步骤
建立检验假设,确定检验水准
建立检验假设
H₀:μ₁=μ₂,两样本的总体方差相等
H:μ₁≠μ₂,两样本的总体方差不相等
检验水准α=0.2
计算检验统计量F值
确定P值,作出统计推断
①若P≤α,按照α水准,拒绝H0,接受H1,两样本的总体方差不相等,差异有统计学意义。(两总体确有差别;两样本差别有统计学意义)。
②若P>α,按照α水准,不能拒绝H0,两样本的总体方差相等,差异无有统计学意义
(3)常见差齐性检验的比较
①F检验
①要求数据服从正态分布
②只用于两样本方差齐性检验
②Bartlett检验
①要求数据服从正态分布
②既可用于两样本方差齐性检验,也可用于多样本方差齐性检验。
③Levene检验
①不依赖总体分布的具体形式,更为稳健。
②既可用于两样本方差齐性检验,也可用于多样本方差齐性检验。
(二)两配对样本均数→配对设计
1、配对设计
(1)定义
是指将实验对象按一定条件配成对子,
再将每对中的两个实验对象随机分配到两个不同的处理组。
以保证不同组间的可比性,这种设计称为配对设计。
配对的因素应为可能影响实验结果的主要非处理因素。
(2)配对设计有两种情况
(1)自身配对
同一对象接受两种处理
如对同一标本同时用两种方法进行检验,
同一患者先后接受两种处理方法;
(2)异体配对
将条件相近的实验对象配对,并分别给予两种处理。
(3)两样本定量资料假设检验的辨析
2、配对设计t检验→满足对子差值正态
(1)定义
又称配对t检验,适用于配对设计的定量数据的两样本均数比较,
其比较目的是检验两配对样本均数所代表的未知总体均数是否有差别。
若两总体均数无差别,理论上配对设计中差值d的总体均数μ应为0,故其检验假设为H:μd=0
(2)基本思想
①比较在相同的配对条件下,两种处理的总体平均效应是否相同。
②假设两种处理的总体平均效应相同,理论上同对实验结果的差数d的总体均数为0
③将差值的样本均数d与已知总体均数为0的差值进行统计学检验;
④若检验结果有统计学意义,可以推断不等于0,并根据研究背景说明两种处理方法的效果有差别,或某种处理有作用。
⑤t检验要求资料满足独立性、正态性和方差齐性。
⑥不同对子间的测量值相互独立
(3)推断的基本任务
①估计未知总体均数μd的1-α置信区间;
②检验样本均数`d所代表的未知总体均数μd是否等于0
(4)适用条件
①配对的两个受试对象分别接受处理之后的数据
②同一样品两种方法(或仪器等)检验的结果
③同一受试对象两个部位的数据
④同一受试对象干预前后的配对
⑤适用于样本来自分布相同总体且研究变量的差值服从正态分布或者近似正态分布
(5)检验步骤
建立检验假设,确定检验水准
建立检验假设
H0:μd=0,两种处理的总体平均效应相同;
H1:μd≠0。两种处理的总体平均效应不相同
检验水准α=0.05
计算检验统计量t值
确定P值,作出统计推断
①若P≤α,按照α水准,拒绝H0,接受H1,差值的样本均数与已知总体均数的比较,差异有统计学意义。(两总体确有差别;两样本差别有统计学意义)。
②若P>α,按照α水准,不能拒绝H0,差值的样本均数与已知总体均数的比较,差异无有统计学意义。
三、多个样本的比较→方差分析
(一)概述
1、方差分析的概念和基本思想
1、方差分析(ANOVA)的概念
又称 F 检验或变异度分析
通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,
用于比较两个或两个以上均数的差别。
对应零假设为H₀:μ1=μ2=μ3……,各总体均数相等,即某因素各水平间的总体均数相同,该因素无效应;
备择假设H₁:各总体均数不等或不全等,即某因素各水平间的总体均数不等或不全等,该因素存在效应。
2、基本思想
根据研究目的和设计类型,将全部数据的总变异进行分解,
总的离均差平方和与自由度均可分解为相应的若干部分,
每一部分离均差平方和可解释为某因素的效应和误差的效应。
计算各部分的均方,均方等于离均差平方和除以自由度,构造统计量F值。
在H₀成立时,F值不会太大。
基于小概率事件原理,通过样本数据计算F值及对应的P值,
可推断该因素是否存在效应,即组间是否存在差异。
2、方差分析的应用条件、用途及优点
1、应用条件
(1)独立
(2)正态→正态性判断方法
①当样本含量较小时
对数据是否来自正态分布总体难以进行直观判断和检验,常凭借经验和数据来源判断
②当样本含量较大时
(1)根据中心极限定理,样本均数的抽样分布往往服从或者近似服从正态分布。此时,只要满足方差齐性,方差分析的结果就具有稳健性。
(2)但当数据严重偏离正态分布。则应考虑做数据转换改善其正态性,或采用非参数检验方法
(3)方差齐→方差齐性判断方法
①假设检验方法
(1)原理
方差分析中对方差齐性的要求较严格,
通常采用方差齐性检验,检验水准α通常设置为0.2
(2)方法
①F检验(F值)
数据服从正态分布。
适用于两样本齐性检验
②Bartlett X²检验
数据服从正态分布
适用于两样本或多样本的方差齐性检验。
③Levenve检验(F值)
(1)适用条件
对数据没有任何要求,结果更稳健,
适用于两个或多个总体方差齐性检验
(2)基本原理
将原始观测值xij转换为相应的离差值zij,
离差值的公式
然后对离差值zij进行单因素方差分析,
若各组总体方差相等,则组间变异与组内变异接近,F值接近于1。
(3)基本步骤
(1) 建立检验假设,确定检验水准
H0=σ²1=σ²2=σ²2,即3个总体方差齐
H1=σ²1≠σ²2≠σ²2,即3个总体方差不齐
α= 0. 20
(3) 计算检验统计量
(4) 确定P值,作出推断
按α= 0. 20水准,
P>α,不拒绝H0,差异无统计学意义,尚不能认为3个总体方差有差异
②图示法
(1)残差图可以同时考察正态性和方差齐性是否满足,是最为简单、直观和有效的可视化图形判断。
(2)若数据满足正态性和方差齐性,则各组残差值服从正态分布且方差齐,标准化的残差值服从标准正态分布,其残差值应该在土2之间随机波动,不具有特殊的分布结构
(3)对于完全随机设计,假定方差分析模型为xij=μi+εij,即每个观察值可以表示为处理的平均效应和不能由处理所解释的效应(残差或剩余)。通常用各组的样本均数`xi作为总体均数μi的估计值,每个个体的残差估计值为eij=xij-`xi。
2、用途
①检验两个或多个样本均数间的差异有无统计学意义
②回归方程的线性假设检验
③检验两个或多个因素间有无交互作用
④方差齐性检验
3、优点
(1)不受比较组数的限制;
(2)可同时分析多个因素的作用;
(3)可分析因素间的交互作用。
3、方差分析的结果解释、意义
1、方差分析结果
为P≤α时,结论为各总体均数不全相等,需进一步进行均数间的多重比较。
常用的两两比较方法SNK法、Dunnett法以及Bonferroni法,统计量与两均数比较的t统计量相似,只是采用MS误差调整合并方差、v误差调整自由度,或者调整检验水准,控制累积犯第I类错误的概率不超过事先设定的α。
2、意义
按照实验设计把总变异分成若干部分,划分得越细,各部分的涵义越明确,对结论亦较易解释;
同时,残余的变异即误差部分越小,因而能够提高检验的灵敏度和结论的准确性。
4、方差分析与t、F检验之间的关系
1、与t检验之间的关系
(1)相同点
①都可用于两个均数的比较,且对应的F=t²
②适用条件都要求独立、正态、方差齐
(2)不同点
①方差分析
a、可用多个均数间的比较
b、不能进行置信区间估计
c、只能检验H₁:μ₁≠μ₂,即只能检验两均数间是否有差异,无法检验μ₁<μ₂或μ₁>μ₂。
d、方差分析的资料要求
(1)完全随机设计
①独立性
个体间相互独立
②正态性
样本来自正态分布总体
③方差齐性
样本的总体方差相等
④和t检验的关系
两组t检验的扩展,F=t²
但并不能完全取代成组设计(两独立样本)的t检验
(2)随机区组设计
①独立性
各区组之间的观察资料相互独立
②正态性
处理组间、区组间满足正态性
③方差齐性
处理组间、区组间数据总体方差相等
④和t检验的关系
①两组配对比较时
配对t检验的扩展,F=t²
②多组比较时
随机区组设计可提高检验功效的目的。
而进行多次两两t检验比较会增大犯I类错误的概率
②t检验
a、用于两个均数间的比较
b、各处理组方差不相等时,t检验可采用校正自由度的办法进行假设检验(即成组t′检验),而方差分析在该情况下不适合。
(3)多组均数比较不能用t检验的原因
①原因
用t检验或Z检验进行多个均数的比较会增大实际犯第I类错误的概率
用方差分析比较多个样本均数,可有效地控制犯第I类错误的概率。
②举例
例如需进行3个均数的比较H0:μ1=μ2=μ3,如果采用t检验则需进行3次两两比较的t检验。
如设α = 0.05,每次t检验不犯第I类错误的概率为0.95,那么3次均不犯第I类错误的概率则为(0.95)^3,而完成这3次t检验,犯第I类错误的概率就变为了( 1-0. 95)^3 ≈0.14,远超过事先规定的0. 05水准。
2、与方差齐性F检验对比
1、相同点
都采用F统计量
2、不同点
(1)方差分析
①检验方式
双侧检验,单侧界值(α=0.05)
针对多个总体均数。
原因
人为把方差大的放在分子上,因此F统计量≥1,故只需要查单侧界值
只查单侧界值,因此界值形式为F0.05(n₁,n₂)
②应用条件
①独立性
各样本是相互独立的随机样本
个体观测值间相互独立。
②正态性
各样本均来自正态分布总体。
③方差齐性
各样本所对应的总体方差相等。
③假设检验
不同样本所代表的总体均值是否相同
(2)方差齐性F检验
①检验方式
双侧检验,双侧界值(α=0.2)
只适用于两组数据
原因
增大α数值,可降低Ⅱ类错误,
尽量避免把方差不齐的数据认作方差齐,进一步提高检验效能
即提高发现实际两者方差不齐的能力,F0.1(n₁,n₂)
②应用条件
独立、正态
③假设检验
两总体方差是否相等
(二)常用的方差分析
1、完全随机设计→单因素,对应单个F值
(一)概述
1、完全随机设计
(1)定义
又称简单随机分组设计
是采用完全随机化分组方法,将同质的实验单位分配到各处理组,各组分别接受不同的处理。
各组样本含量可以相等,称为平衡设计;也可不等,称为非平衡设计。
(2)设计流程图
2、完全随机设计的方差分析
(1)定义
亦称为单向方差分析,将数据按一个方向,即同一处理的不同水平或不同处理,进行分组整理。
是指将研究对象通过完全随机化方法,分配至多个不同的处理组,比较多组的效应指标是否存在差别,
(2)特点
(1)只涉及一个研究因素,除了用于随机分组的实验性研究外,也常用于基于随机抽样的观察性研究多个均数的比较。
(2)单向方差分析假设所有总体方差相同,所以要检验所有总体均值是否相等,也就是要检验所有样本是否来自一个总体。
(3)进行方差分析的前提是各个样本对应的总体方差相等。(说明了各组内变异水平相当)。
(4)方差分析的零假设为
H0:各个样本对应的总体均数相等。
A、若零假设为真,样本均值是总体均值的无偏估计,则抽样数据得到的F的值应该接近于1。
B、如果零假设不真,则F值会显著的大于1。这样可以通过F检验的方式来检验各总体均值是否相等(样本是否来自同一个总体)。
(二)检验步骤
服从正态、满足方差齐——完全随机设计的方差分析
1、前提条件
独立性
①概念
各处理组样本是相互独立的(随机)样本;
②检验——由抽样方式决定
正态性检验
①概念
各处理样本相应的总体服从正态分布
②检验
图示法(原样本数据或残差)——直方图、P-P图、Q-Q图、箱图
正态性检验方法——W法、峰度或偏度的联合检验
方差齐性检验
①概念
各处理组样本相应(总体)方差相等
②检验
图示法——残差图
方差齐性检验方法——Levene 检验、Barlett X ²检验
2、基本思想——变异分解
总变异SS总
①各观察值与总均值之差的平方和,即总离均差平方和,表示总变异的大小;
②自由度
v总=n-1,n为观察总例数
组间变异SS组间
①各处理组均值大小的不同,是由(处理因素和随机误差)造成的;
②自由度
v组间=k-1,k为组数
组内变异SS组内
①同一处理组内部各观察值之间的变异,是由(随机误差)造成的;
②自由度
v=n-k,n为观察总例数
关系
变异
自由度
F值
3、具体步骤
建立检验假设,确定检验水准
检验假设
H0:总体均数相等;
H1:总体均数不等或不全相等
检验水准α=0.05
计算检验统计量F值
(1)方差分析表
(2)具体计算步骤
①先计算C值
②计算总的离均差平方和SS总
③计算组间变异,即组间离均差平方和SS组间
④计算组内变异,即组内离均差平方和SS组内
⑤计算F统计量
公式
查F界值表
a、直接查表
b、用线性插值法近似估计
c、F分布界值是α水平下的单尾值。
确定P值,作出统计推断
P>α,不拒绝H0,差别无统计学意义,各总体均数不全相同,即至少有两个总体均数不相同,需进一步进行两两比较。
P≤α拒绝H0,接受H1,差别有统计学意义,尚不能认为各总体均数不同。
2、随机区组设计→双因素,对应两个F值
(一)概述
1、随机区组设计
(1)定义
又称配伍设计,
通常是将受试对象按影响实验效应的混杂因素特征 (如动物的窝别、性别、体重等)相同或相近者组成b个区组(配伍组),
每个区组中包含k个个体, 再将其完全随机分配至k个不同的处理组,以保证混杂因素影响的组间均衡可比性,从而比较k 个处理组效应的差异。
(3)设计流程图
(4)与完全随机设计的比较
(1)完全随机设计
①基本思想
单因素设计,仅考虑处理因素。
②分组方式
是将受试对象完全随机地分配到各处理组,虽然理论上可以使各组趋于均衡,但在样本含量较小时,各组常常出现不均衡的现象。采用随机区组设计则能保持均衡。
③t检验的扩展
是两组t检验的扩展,对于两个独立均数比较的情形存在F=t²。
(2)随机区组设计
①基本思想
双因素设计,考虑了处理因素和区组因素。
②分组方式
是先将控制因素条件相同或相似的受试对象安排在同一区组,然后将不同区组随机地分配到各处理组,同一区组的受试对象数和处理组数相等。
③t检验的扩展
是配对t检验的扩展,对于两个处理组比较的情形也存在F=t²。
④均衡性
(1)利用区组控制了可能的混杂因素,使处理组间均衡可比,提高了设计效率;
(2)并将区组变异从原组内变异中分解出来,使误差均方减少,提高检验效率。
(3)但实际应用过程中,随机区组设计实施存在较多困难。
⑤统计推断
随机区组设计分解出了区组的变异,使随机误差的变异降低。
MS误差往往会减少,统计量F处理一般会增大,更易得出处理组多个总体均数差异有统计学意义的推断结果
2、随机区组方差分析
1、基本思路
①按区组和处理组两个方向进行分析
b个区组和k个处理组构成b*k个格子,每个格子只有一个数据xij,
i 表示处理的水平数(i=1,2,……,k),j表示区组的水平数(j=1,2,……,b)
处理组与区组的各水平交叉格子没有重复例数,即总例数为n=kb。
因此,随机区组设计的方差分析也称为无重复数据的双向方差分析 。
②遵循原则
应遵循“单位组间差别越大越好,单位组内差别越小越好”原则,
即选择与评价指标关系密切的因素作为配对因素,
并且选择在同一区组内受试对象的配对因素性质的差异越小越好。
2、应用情况
①将n个研究对象按照影响研究效应的混杂因素特征配成区组,再将每个区组的k个个体随机分配至k个处理组。随机区组设计应用于实验研究,也可应用于观察研究。
②将同一样品分成为k份,分别釆用k种不同的处理。
③同一研究对象k个部位的处理效应比较。
3、特点
①利用区组控制了可能的混杂因素,使处理组间均衡可比,提高了设计效率;
②并将区组变异从原组内变异中分解出来,使误差均方减少,提高检验效率。
③随机分配的次数要重复多次,每次随机分配都对同一个区组内的实验单位进行,且各个处理组实验单位数量相同区组内均衡。
④但实际研究中,特别是临床或者人群研究中,随机区组设计实施存在较多困难。
⑤随机区组设计的处理因素和区组因素各水平数交叉的格子内无重复数据,不能对格子间进行正态性和方差齐性检验。但至少处理组间、区组间数据应满足正态性和方差齐性。
⑥可以分别对处理组间以及区组间进行正态性和方差齐性检验。
⑦若其中之一严重背离正态性或者方差齐性,则不满足方差分析的应用条件,可采用非参数检验。残差图也可考察随机区组设计数据是否满足方差分析的应用条件
⑧是配对t检验的扩展,对于两个处理组比较的情形也存在F=t²。
4、优缺点
优点
每个区组内的受试对象有较好的同质性
与完全随机设计相比减少了非研究因素引起的误差(即减少了混杂因素对结果的影响)
因而,更容易发现处理组间的差别,提高了实验效率.
缺点
要求区组内实验单位数与处理数相等,实验结果中若有数据缺失,统计分析较麻烦
5、随机区组方差分析与完全随机方差分析的比较
(1)完全随机设计的方差分析
①数据要求
独立性、正态性、方差齐性
②检验目的
推断多个样本所代表的总体均数是否不等
③H0与H1
H0:各组所代表的总体均数相等。
H1:各组总体均数不全相等(至少有一个不等式成立)。
④检验统计量
⑤关键要点
总变异分解为组间变异和组内变异
SS总=SS组间+SS组内,V总=V组间十V组内
(2)随机区组设计的方差分析
①数据要求
区组间数据独立
处理组、区组间数据满足正态性和方差齐性
②检验目的
推断处理组间与区组间多个总体均数是否存在差异
③H0与H1
随机区组设计的方差分析中需要对区组因素和处理因素分别进行假设检验。
处理组
H0:不同处理水平的均数相同;
H1:不同处理水平的均数不全相同。
区组
H0:不同区组对观测指标的影响相同;
H1:不同区组对观测指标的影响不全相同。
④检验统计量
⑤关键要点
总变异分解为处理组变异、区组变异和随机误差变异
SS总=SS处理+SS区组+SS误差,V总=V处理+V区组+V误差
(二)检验步骤
服从正态、满足方差齐——参数检验方法:两因素方差分析
1、前提条件
①独立性——研究背景
②正态性检验(残差)——W检验
③方差齐性检验(残差)——Levene test或残差图法
2、基本思想——变异分解
总变异SS总
①各观察值与总均值之差的平方和,即总离均差平方和,表示总变异的大小;
②计算公式
处理组间变异SS组间
①处理组的变异表现为各处理组均数相对总均数的离散程度。
②处理组的均方反映处理因素的平均效应和误差效应。
④计算公式
区组间变异SS组内
①区组间的变异表现为各区组均数相对总均数的离散程度。
②区组均方反映区组的平均效应和误差效应。
④计算公式
误差
3、具体步骤
建立检验假设,确定检验水准
①针对处理组
H0:两种或两种以上不同处理组平均效应相同;
H1:两种或两种以上不同处理组平均效应不全相同
②针对区组
H0:对于任何一个处理组,b个区组平均效应相同;
H1:对于任何一个处理组,b个区组平均效应不全相同
③检验水准α=0.05
计算检验统计量F值
(1)方差分析表
(2)计算两个F值
①针对处理组
用于推断处理组间多个总体均数是否存在差异。
②针对区组
用于推断区组间多个总体均数是否存在差异。
确定P值,作出统计推断
(1)根据F0.05(处理,误差);F0.05(区组,误差),查表
(2)对于处理组
① P ≤ α ,拒绝 H0 ,接受H1 ,不同处理组的总体均数存在差异。
② P > α ,不拒绝 H0,尚不能认为不同处理组的总体均数不同。
(3)对于区组
① P ≤ α ,拒绝 H0 ,接受 H1 ,不同区组的总体均数存在差异。
② P >α ,不拒绝 H0 ,尚不能认为不同区组的总体均数不同。
3、多个样本均数间的多重比较
—、SNK 法
①适用情形
经方差分析得出有统计学意义的结论后采用
②目的
比较每两个样本均数所代表的总体均数是否相同,其检验统计量为q,又称q检验
③检验统计量公式
(1) 建立检验假设,确定检验水准
H0:μ1=μ2,即任意比较的两组的总体均数相等。
H1:μ1≠μ2,即任意比较的两组的总体均数不等。
α = 0. 05
(2) 计算检验统计量
(3)确定F值,作出推断
根据计算的q值及误差自由度v,对比组包含的组次a査q界值表。
④应用条件
在研究设计中未考虑均数多重比较问题,如探索性研究,经方差分析结论有统计学意义之后,才决定对多个均数都进行两两事后比较,可采用SNK-q检验。
⑤注意事项→q检验与t检比较的两大等别
①误差
t检验的误差是单纯的两组合并误差;
q检验基于多组共有的误差均方
②检验界值
t检验界值仅与自由度有关;
q检验界值除自由度外,还与组数a有关,均数秩次差别愈大则界值愈大
⑥特点
SNK法的效能是介于Bonferroni法和Dunett-法之间的。
二、Dunnett-t 法
①适用情形
多个实验组与同一对照组比较
②目的
比较各实验组相对于对照组是否存在统计学差异
③检验统计量公式
式中T表示处理组,C表示对照组
④应用条件
应用条件
在设计阶段就根据研究目的或专业知识考虑,
计划好对各均数间进行两两比较,
举例
如同时验证某药品三个剂型的有效性,
只作各剂型与对照组的比较即可,一般采用Dunnett-t检验
⑤注意事项→t检验的两大差别
①误差
t检验的误差是单纯的两组合并误差;
Dunnett-t 检验基于多组共有的误差均方
②检验界值
t检验界值仅与自由度有关;
Dunnett-t 检验的tD界值除自由度外,还与组数T有关,处理组愈多则界值愈大
⑥特点
当要比较的组数较多时,如当组数k>2时,q'检验的检验功效高于q检验
Dunett-t 法检验比Bonferroni法检验更有效。
三、Bonferroni 法
①适用情形
适用于所有的两两比较,但是较为保守。
比较次数过多时不适用,会增加犯II类错误的概率
②目的
比较每两个样本均数所代表的总体均数是否相同
③检验统计量公式
④应用条件
适用于所有的两两比较
⑤注意事项
Bonferroni法是对检验水准进行调整,
当比较次数过多,如m超过10次以上时,调整的检验水准会过低,
多重比较可能会出现不拒绝H0的假阴性结果,即会增大犯第II类错误的概率。
此时,不建议采用Bonferron法
⑥特点
①尽量减少犯第一类错误的概率,但也增大了犯第二类错误的概率,结论相对保守
②调整α值,α'=α/m。
③适用于证实性研究;
③当要比较的组数较少时,Bonferroni 法检验更有效。
四、LSD-t法
①适用情形
又称最小有意义差异检验
用于多组中某一对或几对在专业上有特殊意义的均数进行比较。
同时,即使方法分析结果不足以认为多组间差异具有统计学意义,也可作SD-t检验
②目的
比较每两个样本均数所代表的总体均数是否相同
③检验统计量公式
④应用条件
根据研究目的或专业知识考虑,在设计阶段决定不作全面的多重比较,
如只想比较疾病常见类型之间的疗效差别,此时可采用SD-t检验.
⑤注意事项→与成组t检验的差别
①LSD-t检验中的合并方差为方差分析中的误差均方,自由度为方差分析中的误差自由度
②用LSD-t检验进行两两比较的次数越多,其犯I类错误的概率也越大
⑥特点
①灵敏度高,但犯第一类错误的可能性较大
②调整误差项
③适用于探索性分析;
第7章 定性资料[无序分类(无序多分类、二分类)]的分析(按分析方法)
一、二项分布与Poisson分布
1、二项分布资料
1、单样本率与已知总体率的比较
1、概述
(1)基本任务
①目的估计总体率π的1-α置信区间。
②检验样本所代表的总体率π是否与给定的总体率 π0有差别(H0:π =π0是否成立)
(2)单个样本率的近似正态Z统计量
①正态近似法
1、适用条件
适用于nπ和n(1-π)均大于5的情形
(当总体率未知,用样本率p代替总体率π代入计算)
2、公式
②分子+2,分母+4”校正的正态近似法
1、适用条件
nπ、n(1-π )不大于5的情形。
2、公式
2、检验方法
①直接概率法——二项分布
与给定总体率π₀比较时P值的计算
适用于样本量较小或π0不靠近0.5时,且样本阳性数x较小作单侧检验的情形。
②正态近似法——u检验
①正态近似法
1、适用条件
适用于n较大,p不太靠近0或1,且np与n(1-p)均大于5的情形。
2、与给定总体率π比较的公式
②“分子+2,分母+4”校正的正态近似法
1、适用条件
适用于np、n(1-p)不大于5的情形。
2、公式
2、两独立样本率比较
1、概述
1、基本任务包括
①估计两个总体率之差π1-π2的1-α置信区间。
②检验两个样本率p1和p2所代表的总体率π1和π2是否相等(即检验H0:π1=π2是否成立)。
2、两个样本率之差(p₁-P₂)的近似正态Z统计量
①近似正态法
1、适用条件
n₁P₁、n₁(1-p₁)、n₂P₂、n₂(1-p₂)均大于5时,
2、公式
②“分子+2,分母+4”校正的近似正态法
1、适用条件
适用于n₁P₁、n₁(1-p₁)、n₂P₂、n₂(1-p₂)不大于5的情形
2、公式
采用在两组样本率p₁和p₂上分别实施“分子+1,分母+2”校正
2、检验方法——正态近似法u检验
①正态近似法
1、适用条件
①适用于n₁P,n₁(1-p₁),n₂P₂,n₂(1-p₂)均大于5的情形
②当n₁、n₂较小时,无法使用正态近似法,可采用Fisher确切概率法
2、公式
②“分子+2,分母+4”校正的近似正态法
1、适用条件
适用于n₁P₁、n₁(1-p₁)、n₂P₂、n₂(1-p₂)不大于5的情形
2、公式
Sp₁-P₂=
2、Poisson分布资料
3、样本与总体平均事件发生数的比较
1、目的
检验样本所来自总体在观察单位内(平均事件数μ)是否等于知总体,在观察单位内(平均事件数μ0)
2、检验方法
①正态近似法
μ≥20或n>30时
②直接计算概率法(Poisson分布原理)
一般认为单位事件、空间或人群中某独立事件的发生数服从Poisson分布
4、两独立样本平均计数检验
1、目的
推断两个样本所代表的总体计数有无差别。
2、检验方法→近似正态分布的均数检验
①两样本观察单位数相同
应用条件——X1>30,X2>30
②两样本观察单位数不同
应用条件——X1>30,X2>30
3、中位数和百分位数的比较
二、卡方检验
1、两独立样本率或构成比的比较(2x2列联表)→分组变量和指标变量均为两分类
1、概述
1、X²检验的基本思想
将对两个或多个总体率或构成比的比较转化为实际频数与理论频数吻合程度的比较
在每一条自由度固定的X²分布曲线下,各个X²值与其特定概率P值相对应。
若X²值所对应的概率小于或等于事先所规定的检验水准,
即可说明实际频数和理论频数吻合程度较差,
从而有理由拒绝H0,接受H1,认为总体间的差别具有统计学意义
反之,若实际频数与理论频数的吻合程度较高,则不能拒绝H0,尚不能认为总体间存在明显的差别。
2、独立样本2×2交叉表,亦称四格表
1、四格表
2、理论频数
(1)含义
在H0成立的前提下,按照合并的样本率估算,各组应分配的平均频数
(2)理论频数要求
①不得有理论频数小于1,或1<T<5格子数不超过总格子数的1/5
(3))处理方法
②理论频数小于1,采用Fisher确切概率法
②当1<T<5格子数不超过总格子数的1/5时
①增加样本含量
②合理合并理论频数太小的行或列
③删除理论频数太小的行和列
③当效应指标为有序分类变量资料时,各组效应的比较宜采用秩和检验
3、四格表X²检验的适用条件
① 若n≥40,且任意一个格子的理论频数Tij≥5,可直接使用。
②若n≥40,但出现1个格子的理论频数1≤Tij<5时,则需对X²值进行连续性校正。
③若n<40或者任意一个格子的理论频数Tij<1时,则X²检验不再适用,宜釆用Fisher确切概率法进行处理。
3、x²统计量计算公式
(1)X²检验的基本公式
①适用条件
若n≥40,且任意一个格子的理论频数Tij≥5
②公式
自由度
v=(行数-1)(列数-1)
是指在表中周边合计数不变的前提下,基本数据可以自由变动的格子数
(2)连续性校正公式
①适用条件
若n≥40,但出现1个格子的理论频数1≤Tij<5时
②公式
4、X²检验的主要用途
(1)两个或多个总体率(或构成比)的比较。
(2)两个或多个分类变量的关联性分析
(3)频数分布的拟合优度检验。
(4)有序分组资料线性趋势检验。
5、两个率的z检验和x²检验的联系和区别
(1)联系
①都可以检验两个率之间的差别,且都基于零假设应用了合并率的概念(Pc 和Tij)
②两种检验的应用条件均满足时两者等价,即z²=x²。
③都存在连续性校正的问题。
(2) 区别
①单双侧
率的Z检验可按研究设计进行单侧或双侧假设检验,
x²只能进行双侧检验(单侧界值)
②差异性检验
率的Z检验只能检验两个率之间的差别,
x²能检验两个或多个率的差别。
③应用
率的Z检验可以计算两率之差的95%置信区间,以分析两率间有无实际意义,
x²检验用于2x2列联表资料有无关联的分析。
6、定性资料假设检验的正确应用
独立性检验
一、2x2交叉表的独立性检验
1、概述
1、独立性检验的相关概念
(1)独立性检验
当需了解两个或多个分类变量的关联性及其强度,
此时可采用关联性检验,也可称为独立性检验。
(1)独立随机样本
一般地,变量X和变量Y互相独立
是指变量X 的概率分布与变量Y的概率分布互不相关,
即称其为独立随机样本。
(2)交叉分类
若分类变量的概率分布彼此相关,则称其为交叉分类。
常见于一份随机样本同时按两种不同属性分类。
2、基本思想
通常是先针对交叉分类表进行两种属性独立性的X²检验,
再计算关联系数以描述两个属性之间的关联强度。
一般假设H0:两变量之间互相独立;H1:两变量之间互相关联。
在H0成立的条件下,该统计量应服从X²分布。
若X²统计量大于检验水准对应的X²值,则拒绝H0,接受H1,认为两变量存在关联
反之,则可认为两变量相互独立。
3、举例适用情况
①随机抽取2000例大骨节病区人群,分别观察其男女性别与大骨节病发病与否两种属性,并推断两种属性之间的关联性。
②同一批监测水样两种不同检测结果的关联性。
③同一批大学生其专业类型与防艾知识知晓状况之间的关联性。
2、2x2交叉表的独立性检验步骤
3、分类变量的独立性检验与率(或构成比)的差异性分析比较
1、相同点
在检验过程和方式上完全一致
2、不同点
(1)拟合优度检验
①目的
推断样本服从什么样的分布,是否与某一期望分布吻合
②样本举例
一组样本的一个变量
③检验方法举例
回归模型对数据的拟合程度分析、拟合优度卡方检验
(2)差异性检验
①目的
研究不同类别数据间的差异性
②样本举例
两个或多个样本的相同变量
③检验方法举例
方差分析、t检验、卡方检验、秩和检验
④性质
而率(或构成比)的比较,则主要针对两个或多个独立随机样本所形成的交叉表,
侧重于推断其分别所代表的总体率(或构成比)之间是否存在差异性
(3)关联性分析
①目的
研究随机变量间的相关关系
②样本举例
一组样本的两个变量
③检验方法举例
交叉列联表数据独立性卡方检验;
定量数据间的相关分析
④性质
主要针对同一随机样本的两个不同属性变量所形成的交叉表,
侧重于推断两个不同属性变量之间存在关联性与否;
二、2 x 2配对数据的独立性检验
三、RXC交叉表数据的独立性检验
(1)x²检验的应用
①两个率的比较,要求总例数n≥40,且4个理论频数T均大于5,方可用X²检验;当n≥40但有一个理论频数l≤T<5时,需用校正X²检验;若出现T<1或n<40时,则用确切概率法检验为妥。两样本率比较时,如为双侧检验,则u检验和四格表X²检验是等价的,校正u检验和四格表校正X²检验也是等价的,应用条件亦相同。若为单侧检验,则用u检验较为方便。
②多个率或构成比的比较,其自由度大于1,此时行×列表中不宜有1/5以上格子的理论频数小于5,或不宜有一个理论频数小于1。但亦有人认为这个限制过严,可有多个理论频数小于1而对分析影响不大。
对理论频数太小的样本有3种直接的处理办法
(a)最好增加样本例数以增大理论频数。
(b)删去上述理论频数太小的行或列。
(c)将太小理论频数所在行或列的实际频数与性质相近的邻行或邻列的频数合并,使重新计算的理论频数增大。
(2)似然比检验的应用
当自由度大于1时,率或构成比的比较可以用似然比检验。
此时,即使在有个别理论频数比较小,其检验效果仍然是比较好的。
其检验统计量G在样本例数n较大时近似服从X²分布;可按X²分布界定。
(3)确切概率检验的应用
理论上,对2×2或R×C表,均可以计算确切概率,结果可信,且不受样本含量及理论频数的影响。但当自由度较大,或样本含量比较大时,计算机计算也是很耗时的。因此,确切概率法多用于小样本的四格表检验。
(4)当多个样本率(或构成比)比较的假设检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步明确差别之所在,则须进行多重比较。
(5)率或构成比之X²检验及相关方法,都假设各比较组间是独立的,组与组之间是无序的。如果组间是有序的,例如,比较3种病情(轻、中、重)的病人之治愈率,那么此时用X²检验只能得出3组间有无差别(大小比较),却得不到病情越严重治愈率越低之结论(相关性分析)。这类资料可用秩和检验、相关分析等。
7、统计分析方法的选择
单项有序
①分组变量有序,指标变量无序分析不同组间的(构成)情况
行x列表资料的X²检验
例如10~、20~、30~三个年龄组(有序变量)的性别构成比差异
②分组变量无序,指标变量有序分析不同组间的(等级强度的差异)
秩转换的非参数检验,即Wilcoxon符号秩和检验
例如比较两地某病病情程度(有序变量)
双向无序
①多样本率(或构成比)的比较
行x列表资料的X²检验
例如三组脂肪变性的总体发生率是否相关
②分析两个分类变量之间(有无关联性)以及(关联密切程度)
行x列表资料的X²检验+pearson列联系数
例如是否患糖尿病与肥胖之间存在相关
双向有序
①属性相同
分析两种检测方法的(一致性)
一致性检验或Kappa检验,也可用特殊模型分析方法
②属性不相同
①两个有序分类变量间有无差别
可将其视为单向有序资料,选用秩转换的非参数检验
例如
②两个有序分类变量间是否存在(相关)关系
Gamma系数
例如
①两个有序分类变量间是否存在(线性变化趋势)
线性趋势检验
例如
2、两样本率的卡方X²检验
1、四格表的基本形式
2、假设检验步骤
①建立检验假设,确定检验水准
H0:各组总体率(或构成比)相同;
H1:各组总体率(或构成比)不相同
α=0.05
②求检验统计量:卡方值和自由度v
(1)n≥40,且所有T>5时
公式
四格表专用公式
自由度:v=1
卡方值的特点
若各实际频数与理论频数(完全相同),则卡方值比为零
卡方值(永远是正值),且实际频数与理论频数的相对差异越大,卡方值也越大
格子越多,即(自由度越大),卡方值也会(越大)
(2)n≥40,但1≤T<5时
校正卡方检验公式
四格表校正公式
自由度:v=1
校正原因
卡方分布原来是正态变量的一种分布,卡方界值表就是根据这种连续性分布而计算出来的,但分类资料是间断的,由此计算的卡方值不连续,尤其是自由度为1的四格表,其P值可能偏小
③查X²界值表,确定P值,作出统计推断
若P≤0.05,在α= 0. 05水平上拒绝H0,接受 H1,可以认为两个两总体率不同。
若P>0.05,按α= 0. 05的检验水准,不能拒绝H0,尚不能认为两个两总体率不同
2、多个样本率或构成比比较(RxC列联表)
1、概述
1、注意事项
1、适用条件
①要求理论频数不宜太小。
②不能有1/5以上格子理论频数1<T<5,
③也不允许出现一个格子的理论频数T<1,否则,结果容易产生偏差。
④属于完全随机设计多个率(或构成比)的比较,强调的是样本的独立性。
2、不能进行卡方检验时的解决方法
(1) 若理论频数过小或有1/5以上格子理论频数小于5时,应考虑增加样本量,或结合专业知识对行或列进行合并。
(2)若出现一个格子的理论频数小于1,应采用Fisher确切概率法。
2、对于RxC表资料,如何选择适合的统计学方法
①双向无序
②单向有序
③双向有序
2、X²检验步骤
(1)建立检验假设,确定检验水准
H0:各组总体率(或构成比)相同;
H1:各总体率(或构成比)不全相同
α=0.05
(2)计算X²检验统计量
(1)基本形式
(2)公式
如果是多个率的比较,其基本数据有R行2列,构成R×2表,用以表述R个率的基本数据,R×2表的x²检验用于推断R个样本率各自所代表的总体率是否相等。——分组变量为有序或无分类,指标变量为两分类资料
(3)举例
①多个率的比较
②构成比的比较
(3)确定P值,作出推断:查X²分布表
若P>0.05,不拒绝H0,尚不能认为各组总体率(或构成比)不同;
若P≤0.05,拒绝H0,可以认为各组总体率(或构成比)不全相同。
3、X²的多重比较
1、基本思想
进行X²分割,将RXC表分割为若干个小的四格表进行检验。
率的多重比较与均数的多重比较,在检验思想上是完全一 致的。
研究者可以依据研究的具体目的,选择率的两两比较,亦可选择与共用对照比较。
2、举例
(1)Scheffé可信区间法
(2)Dunnett-t 法
1、NOC组和DON组比较
2、( NOC+DON )组与DON组进行比较
3、配对设计样本率比较
1、配对四格表(2x2表)x²检验
1、概述
(1)含义
其行、列变量是相互关联的,甚至反映的是一个事物的同一属性,常见于配对或配伍组设计。
(2)举例常见适用情况
①将每个待测标本一分为二,分别采取两种不同方法进行检测,比较两种不同检测方法有无差别;
②为评价某种处理是否产生作用,测定同一批患者受试前后某项指标的阳性反应等
2、基本内容
1、基本形式
2、检验目的
①两种处理比较率差别分析——①McNemar检验(配对的卡方检验)
①公式及适用条件
b+c<20时,选择确切概率法
②假设检验步骤
①建立检验假设,确定检验水准
H0:两者(率)相同;
H1:两者(率)不相同
α=0.05
②求检验统计量:卡方值和自由度v
③确定P值,下结论
②两种处理效应关联性分析——独立四格表卡方检验
①公式及适用条件
②假设检验步骤
①建立检验假设,确定检验水准
H0:两种处理效应之间(无关联性);
H1:两种处理效应之间(有关联性)
α=0.05
②求检验统计量:卡方值和自由度v
③确定P值,下结论
2、配对RxR交叉表数据的X²检验
1、目的
研究的是两个样本分布所对应的总体概率分布是否相同。
检验步骤
(1)立检验假设,确定检验水准
H0 :两变量的概率分布相同;
H1:两变量的概率分布不同。
α = 0. 05。
(2)计算统计量
(3)确定P值,作出推断:查X²分布表
若P>0.05,按α=0.05 的检验水准,不拒绝H0,尚不能认为两变量的概率分布不同
若P≤0.05,按α=0.05的检验水准,拒绝H0,可以认为两变量的概率分布不同。
4、四格表的Fisher确切概率法
一、Fisher精确概率检验
基本思想
保持周边合计数不变,
计算交叉表中各个实际频数变动的所有可能组合所对应的概率,
再将获得现有样本的概率以及比它更极端的所有概率求和,
直接求出单侧或双侧的累计概率进行推断。
是一种基于超几何分布理论可直接计算概率的检验方法。
Fisher确切概率法不属X²检验范畴。
公式
二、2X2交叉表的Fisher 确切概率法
1、适用条件
①样本含量n<40;
②有一 个格子的理论频数T<1。
③X²检验后所得概率P接近检验水准α。
2、2X2交叉表Fisher确切概率法分析步骤
1、建立检验假设,确定检验水准
2、计算所有可能组合的概率Pi
在四格表周边合计固定不变的条件下,
计算表内4个实际频数变动时的各种组合的概率Pi(所有各种可能组合数=最小周边合计+1)。
3、确定P值,作出推断
(1)双侧概率
找出概率小于或等于原四格表概率的所有四格表,将其对应的概率相加。
(2)单侧检验
①当H1为π1<π2时,P值为原四格表及以上的四格表的Pi之和;
②当H1为π1>π2时时,P值为原四格表及以下的四格表的Pi之和。
双侧检验时,需按式(7.15)分别计算两侧所有|A—T|值等于及大于现有样本|A—T|值的四格表的P;值,然后相加,即得双侧检验的P值,见例7.10。
单侧检验时,按研究目的只需计算一侧所有A-T值等于及大于(或等于及小于)现有样本A-T值的四格表的P;值,然后相加,即为单侧检验的P值。
三、R XC交叉表的确切概率法
1、适用条件
(1)多个样本率或多个频率的分布比较X²检验中,一般要求其理论频数不能过小,不能有1/5以上 格子的理论频数1<T<5,也不允许有一个格子的理论频数T<1,否则结果容易产生偏性。
(2)可增大样本量,以达到X²检验的应用条件;亦可采用Fisher确切概率法。
5、率的线性趋势卡方检验
6、拟合优度检验—第9章
2、检验方法
1、概述
1、定义
判断实际样本的观察频数分布是否服从某一理论期望频数分布,即拟合优度检验。
其应用范围较广,通常用以判断某一变量观察值是否服从某一既定的理论分布,
如:正态分布、 二项分布、泊松分布等等。
在H0成立的前提下,若观察个数n足够大,算得的X²统计量近似地服从自由度为v = k-1的X²分布。
自由度为v = k-s-1。k为组段数,s为样本统计量代替总体参数的个数。例如若样本统计量均数和标准差2个(s=2)。
2、基本步骤
①编制频数表,获得样本观测值落在各组段的实际频数Ai。
②根据正态分布的标准转换求出样本落在该组段的概率Pi,利用概率Pi,求出对应的理论频数Ti。
③根据理论频数Ti与实际频数Ai的吻合程度,计算X²统计量,确定P值,作出结论
2、基本思想
①拟合优度检验不针对具体的参数,而是(针对分布类型)
②是推断单样本的k组频数(分布与某一理论分布是否相同)的假设检验方法
③指样本实际频数“拟合”期望频数的(优劣程度)
4、注意事项
①卡方值反应了实际频数与理论频数的吻合程度
②卡方值的大小取决与A-T的差值,还取决与自由度v
③拟合优度X²检验要求足够的样本含量。
④若样本含量不够大(如频数表有1/5 以上组的理论频数1<T<5),可以通过连续性校正的X²检验公式进行统计量的估算。若样本量仍然很小,可人为进行适当的合并
3、与多个独立样本率(构成比)比较的X²检验的关系
1、频数分布拟合优度的X²检验
①目的
判断某一变量观察值是否服丛某一既定的的理论分布
②资料形式
频数分布表
③H0,H1的设立
H0:资料服丛某已知理论分布
H1:资料不服从某己知的理论分布
④自由度
组数-1-根据样本数据估计参数的个数
2、多个独立样本率(构成比)比较的X²检验
①目的
推断多个总体率(构成比)是否相同
②资料形式
R×C表
③H0,H1的设立
H0:多个总体率(构成比)相等
H1:多个总体率(构成比)不全相等
④自由度
(行数-1)(列数1)
1、Pearson X²检验
1、概述
(1)适用条件
①可用于任何分布的拟合优度检验,统计量x²度量了各组实际观察频数与理论观察频数的相对偏离。
②X²检验既可用于离散型分布的拟合优度检验,亦可用于连续性分布的拟合优度检验,在拟合连续型分布前,首先要对资料进行分组,统计学上称为离散化。
(2)两个缺点
①要求每组的理论观察频数不少于5。当频数分布不均衡时,所需样本含量较大
②当用于连续型分布时,要求先对观察值进行分组,而检验结果与分组的取值有关,不适当的分组,可能导致结论的错误。
2、检验步骤
建立检验假设,确定检验水准
检验假设
H0:样本资料服从某一概率分布f(X);
H1:样本资料不服从f(X)
检验水准α=0.2
求出H0为真时的理论频数
计算卡方统计量及自由度
(1)步骤
①假设随机变量X是来自总体的一个随机抽取的样本。
② 计算全距R,确定拟分组数。
③计算样本观测值落在各组段的实际频数。
④计算样本值落在第i组段的概率。假设H0成立,据正态分布的标准转换求出样本落在该组段的概率Pi。
⑤计算各组对应的理论频数:Ti=nPi。
⑥计算X²值:若H0成立,有理由认为样本所代表的总体分布应该和既定的理论分布相符。反之亦然。
(2)公式
要求理论频数大于5
v=k-1-g
A—实际频数、T—理论频数、
k—组数、g—以样本含量估计参数的个数
确定P值,作出统计推断
①可以证明:如果样本含量较大,当H0为真时,检验统计量卡方服从自由度为v=k-1-g的卡方分布
②当检验统计量的卡方值>卡方界值时,可以拒绝H0,认为样本所在总体分布与f(X)分布不相同
2、Kolmogorov检验
又称Kolmogorov-Smirnov检验,其统计量D是反映实际累积分布F与理论累积分布F0之间的最大绝对差
3、正态分布的矩法检验
1、概述
对连续型分布资料,可以计算偏度系数和峰度系数。
由于正态分布的偏度系数和峰度系数均为0,因此,偏度系数不等于0或峰度系数不等于0均称为偏态分布(偏离正态分布)。
偏度系数及其标准误的计算公式为
偏度系数小于0的分布称为负偏态或左偏态分布,
偏度系数大于0的分布称为正偏态或右偏态分布。
峰度系数及其标准误的计算公式为
小于0的峰度系数称为平坦峰,大于0的峰度系数称为尖峭峰。
H₀:偏度系数和峰度系数均为0(分布为正态);
H₁:偏度系数或峰度系数至少有一个不为0(分布为偏态)。
α =0.20。
两个检验统计量为
其中,ug₁,ug2为正态离差。
正态分布的矩法检验
就是利用正态分布的偏度系数和峰度系数均为0的特点,对偏度系数和峰度系数作假设检验。由于
称为m阶中心矩,故又称矩法检验
2、检验步骤
正确应用
(1)关于检验水准
分布拟合优度检验的主旨是推断一个样本是否来自某已知分布型或特定分布型的总体。若意在“接受”H₀,则应控制第二类错误,选取较大的α值作为检验水准,这样才可在获得P>a时,以较小的风险“确认”H₀成立。一般取α=0.20水准,甚至0.30、0.50;建议慎用α=0.10或更小的α取值。若意在拒绝H₀,则应控制第一类错误,此时的检验水准仍应选取α=0.05等小值。如果界定P>0.20表示接受H0,同时界定P≤0.05表示接受H₁,那么,当P值介于0.05~0.20之间如何结论?这个问题参见5.5.3节。
(2)分布拟合优度检验均用双侧检验。
(3)Pearson X²检验适用于定性资料和等级资料的分布拟合,一般要求样本含量较大,因为每个组的理论频数均要大于
④几乎所有的分布拟合优度检验方法均适用于正态分布的拟合
,但正态分布的拟合最适宜用矩法检验和Kolmogorov检验。
Kolmogorov检验对样本含量的要求不高,对n<50的样本效果较好;矩法检验较适用于中等样本含量者;而对大样本,矩法检验过于灵敏,第一类错误率较大,即在同样的α水准较易得出P<a的结论。至于小样本资料的拟合,由于其分布本身尚不稳定,故应谨慎从事。
⑤X²检验也可以用于定量资料的分布拟合,但必须先行分组。
由于分组会损失部分信息,不同的分组策略又可能对结果产生影响,因此,分组的粗细要适当,要能正确反映资料的分布特征。Kolmogorov检验适用于定量资料的分布拟合,并放宽了对样本含量的要求,因此,对定量资料分布的拟合优度检验,最好还是用Kolmogorov检验。
第8章 等级资料(有序分类)的分析——秩和检验
一、单个样本——Wilcoxon符号秩和检验
1、概述
1、基本思想
Wilcoxon符号秩和检验的假设是针对总体的中位数而不是总体均数
目的是推断观测值的总体中位数与某给定数值(如标准值、目标值等)是否相等
即H0:M1= M0,样本所对应的总体中位数M1与给定的总体中位数M0 相同,
然后计算样本中所有数值与给定中位数的差值,对所有差值的绝对值进行编秩,将所有正差值的秩 R+相加 ;将所有负差值的秩R -相加 。
假设H₀成立,理论上,R+与R-的总体均数应相等,等于
R+与R-的总体标准差也应相等,等于
若R+与R-相差悬殊,均远离μR,则有理由拒绝H₀
2、秩和检验的正确应用
2、秩和检验的适用范围
(1)等级资料
(2)定量资料
①数据的某一端或两端无确定数值
②数值的分布是极度偏态的,或个别数值偏离过大,而不属于"过失误差"者
③各组离散程度相差悬殊,即使经变量变换,也难以达到方差齐性;
④分布型尚未确知
(3)兼有等级和定量性质的资料。
4、当观察指标为等级变量时,为什么使用秩和检验?
①两组或多组等级资料的比较,如选用 RxC 列表资料的X²检验,只能推断出两组或多组的总体概率或构成比是否有差别,而不考虑等级间的程度关系。若采用秩转换的非参数检验,可考虑等级间的程度变化,推断两组或多组的等级强度有无差别。
②由于等级变量既有分类变量特征,又有定量变量的特征,用分类变量的检验方法(如X²检验)则无法体现其定量的特性,而采用定量变量的检验方法(如t检验、方差分析)则无法满足这些方法的条件(如非正态分布),而秩和检验不用考虑定量资料的分布情况,又能通过编秩体现其定量的特性,因而最适合等级资料的分析。
3、不同情形下秩和检验的零假设和编秩特点
1、参数检验
①单样本资料
单样本t检验
②配对设计资料
配对t检验
③两独立样本资料
两独立样本t检验
④多组独立样本资料
单因素方差分析
⑤随机区组设计多样本资料
随机区组设计的方差分析
2、秩和检验(非参数检验)
①单样本资料
②配对设计资料
Wilcoxon符号秩和检验
零假设(H0)
差值总体中位数为0
编秩
差值绝对值从小到大
数据特点
①样本数据(配对差值)来自非正态总体或总体分布未知
③完全随机设计两独立样本资料——Wilcoxon秩和检验
零假设(H0)
两总体分布相同
编秩
两组混合编秩
数据特点
①两样本为连续型变量,来自非正态总体或者方差不齐
②分组变量是二分类变量,指标变量是有序多分类变量。如“疗效”的四个等级。
④完全随机设计多组独立样本资料——Kruskal-Wallis H检验
零假设(H0)
各总体分布相同
编秩
多组混合编秩
数据特点
①多组独立样本为连续型变量值,来自非正态总体或方差不齐;或进行数据变换仍不满足正态性或方差齐性。
②各样本指标为有序多分类变量。
⑤随机区组设计多样本资料——Friedman-M秩和检验
零假设(H0)
用专业假设
编秩
先在区组内编秩,再求各组秩和
数据特点
①各处理组数据不满足方差分析的条件,或变换后仍不能满足条件
②各样本指标为有序多分类变量。
⑥有序分类资料的秩和检验
零假设(H0)
用专业假设
编秩
先求平均秩,再求各组秩和
2、检验步骤
(1)建立检验假设,确定检验水准
H0:M1=M0,即样本所对应总体的中位数等于已知总体中位数。
H1:M1≠M0,即样本所对应总体的中位数不等于已知总体中位数
α= 0. 05
(2)求差值、编秩、求秩和
计算所有数值与已知中位数的差值,并对差值的绝对值进行编秩。
若差值为0时,则弃去不计,n随之减少。
分别计算正、负差值的秩和,得出R+与R-。
(3) 计算检验统计量
A、样本量较小(n≤50)时
使用查表法
任取R+或R-作为符号秩和检验的检验统计量
B、如果样本量较大(n>50)
则检验统计量近似服从正态分布,可通过对检验统计量进行标准化变换获得Z值。
可以用R+或R-作为W。0.05为连续性校正系数,因为Z值是连续的,而W却不连续
(4) 确定P值,作出推断
① n ≤50,查表原则——内大外小
(a 、若统计量值在上、下界值范围内,其 P 值大于相应的概率水平。
b、若统计量恰好等于界值,其 P 值等于相应的概率水平。
c 、若统计量在上下界值范围外,其 P 值小于相应的概率水平)
② n >50,使用正态近似法(检验统计量近似服从正态分布)。
1、单样本数据的符号秩和检验
(1)求差值
(2)建立检验假设,确定检验水准
H0:样本所对应总体的中位数等于已知总体中位数,M1=M0
H1:样本所对应总体的中位数不等于已知总体中位数,M1≠M0
α=0.05
(3)编秩
依差值的绝对值从小到大编秩
若绝对值相等则取平均秩次,
若差值为零则舍去不计,同时样本数-1,将差值的正负标在秩次之前。
(4)求秩和
分别求正负秩次之和
可通过(T+)+(T-)=(n+1)/2验证结果,
(5)确定检验统计量
Tmin(T+,T-)
(6)确定P值,作出推断结论.
二、两样本
8.2两组比较的秩和检验→Wilcoxo秩和检验
(一)概述
1、Wilcoxon秩和检验的基本思想
第八版
又称 Mann-Whitney 检验,
分别抽取样本量为n1和n2的两个样本,总例数为N = n1+n2。
将全部数据统一编秩,取任意样本的秩和作为Wilcoxon秩和检验统计量W,
假设两个总体分布相同(H0),则W的均数和标准差分别等于:
μw=n1(N+1)/2,σw=a1n2(N+1)/12
当W远离μw,有理由拒绝H0,具体通过W的抽样分布计算P值获得推断结论。
第三版
如果待比较的两个样本(样本含量分别为n₁及n₂)来自同一总体或分布相同的两个总体(即H₀成立),
则含量为n₁的样本之实际秩和T与其理论秩和n₁(N+1)/2之差[T-n₁(N+1)/2]纯系抽样误差所致,故此差值一般不会很大,而差值越大的概率越小。
若从现有样本中算得的T与其理论秩和相差很大,则说明从H₀规定的总体中随机抽得现有样本及更极端样本的概率P很小,如小于等于检验水准α,则可拒绝H₀。
2、前提
①不满足方差齐性或正态性
②分布未知
③一端或两端无确切值
(二)两组独立样本的秩和检验歩骤及编秩规则
①定量资料
(1)建立检验假设,确定检验水准
H0:两总体分布相同
H1:两总体分布不同
α=0.05
(2)编秩
①将两组原始数据混合,由小到大排序编制
②遇到相同数据,取平均秩次
相当于对原始数据进行秩转换,其目的是用秩数据代替原始数据进行分析,从而不受原始数据需满足正态分布的条件限制。
(3)求秩和
①当两样本例数不等时,以样本例数小者为n1,其秩和为T
②相等时,可任取一组的秩和为T
(4)确定检验统计量T
①两组样本含量不等——以样本含量较小组的秩和作为统计量T
②两组样本含量相等——任取一组秩和作为统计量T
③若相同秩次过多(如超过25%),应进行校正,u经校正后将略增大,P值相应减小
③确定P值范围,作出推断结论
查表法
应用条件——n1≤10,且n2-n1≤10
P值方向口诀——内大外小
统计量T在T界值范围之内,P>0.05
统计量T等于T界值或界值范围之外,P≤0.05
正态近似法
应用条件——n1>10,且n2-n1>10
统计量
在无相同秩次时使用
②等级资料
与定量资料类似
区别
一般等秩数据较多,经常需要以平均秩进行编秩,并进行校正
8.4配对设计资料的秩和检验——Wilcoxon符号秩检验
1、基本思想
推断配对资料的差值是否来自中位数为0的总体
假设两种处理的效应相同,即H0成立,或差值总体的Md=0,则差值的总体分布应该关于0对称,T+=T-=n(n+1)/4
在H0成立的情况下,若T远离n(n+1)/4,并且P<α,小概率事件,一次抽样一般不会发生;
在H1成立的情况下,大多数情况下T离n(n+1)/4相对较远或很远,故拒绝H0
适用于样本来自分布不同总体且样本量较小时,研究变量的差值不服从正态分布
2、检验步骤
建立检验假设,确定检验水准
建立检验假设
H0:Md=0,差值的总体中位数为0;
H1:Md≠0。差值的总体中位数不为0
检验水准α=0.05
计算检验统计量t值
①编秩,求秩和
按照差值的绝对值大小进行编秩,将差值的正负号标在秩次之前
绝对值相等者,若符号不同取平均秩次
零差值不参与编秩,同时样本数减1
②计算检验统计量T值
分别求正、负秩次之和,以较小者为检验统计量T
②样本量较小(n≤50)——查表法
任取R+或R-作为符号秩和检验的检验统计量
①样本量较大(n>50)——正态近似法
进行标准化变换获得Z值。
可以用R+或R-作为W。
0.05为连续性校正系数,因为Z值是连续的,而W却不连续。
确定P值,作出统计推断
①查表法(5≤n<50)——内大外小
统计量T在T界值范围之内,P>0.05
统计量T等于T界值或界值范围之外,P≤0.05
②正态近似法(n>50——构建统计量Z
三、多个样本
1、多组比较的秩和检验——完全随机设计
(一)Kruskal-Wallis H检验的基本思想
①适用条件
①偏态(非正态)分布
②多个组中有一个组的方差太小或太大
③观察指标是有序分类变量
②基本思想
用所有观测值的秩代替原始观测值进行单因素方差分析。
Kruskal-Wallis检验的检验统计量实质是用秩计算组间变异,
当组间变异的数值较大,有理由认为组间存差异
假设k个总体分布相同(H0)且样本例数n1不太小时,
H值近似服从v = k-1(k为组数)的X²分布,通过X²分布计算出P值。
若有相同秩出现,则需进行校正。
当H0为真时,各组实际平均秩与所有资料平均秩的偏差(很小或较小)
当H1为真时,各组的平均秩和差异可能(较大或很大)
(二)检验步骤
1、比较率差别分析——Kruskal-WallisH秩和检验)
①定量资料
(1)建立检验假设,确定检验水准
H0:k 个处理组对应的总体的分布相同。
H1:k 个处理组对应的总体的分布不同。
α=0.05
注意:备择假设为"不全相同"
(2)编秩、求秩和
将多组观测值混合后由小到大统一编秩,
遇相同数值时在同一组内,可顺次编秩;
当相同数值出现在不同组时,则必须求平均秩次。
将各组秩次相加即得 Ri。
(3)计算检验统计量
①无相同秩
②有相同秩次出现时,需要进行校正
He=H/C
0<C<1;校正后,He比H大,p值减小。【选择】
(4)确定P值,做出推断
①查H界值表
若组数k=3,每组例数≤6时
可查H界值表得到P值。
②查X²界值表
若k≥4,或最大样本例数大于9,则H近似服从v=k-1的X²分布
查X²界值表得到P值
P>α,不拒绝H0,差别无统计学意义,即各总体分布相同
P≤α拒绝H0,接受H1,差别有统计学意义,即各总体分布不全相同
②等级资料
与定量资料类似
区别
一般等秩数据较多。
经常需要以平均秩进行编秩,并进行校正,
③两两比较的秩和检验(扩展的t检验法)
①当结果为拒绝H0,认为各总体分布不全相同时,需进行两两比较的秩和检验
②下调检验水准(降低犯第一类错误)后采用Wllcoxon秩和检验两两组间逐一分析
③检验步骤
(1)建立检验假设
H₀:所比较的两个总体分布相同;
H₁:所比较的两个总体分布不同。
α =0.05。
(2)求各组平均秩次`R
(3)计算检验统计量
式中RA及RB为两对比组A与B的平均秩次,
nA与nB为样本含量;k为处理组数;N为总例数;
H为Kruskal-Wallis的H检验中算得的统计量H或Hc值。
式中分母为(RA—RB)的标准误
(4)确定P值,做出推断
2、相关关系分析——Spearman等级相关
①资料类型一双变量有序分类资料
②检验步骤
(1)建立检验假设,确定检验水准
H0:rs=0
H1:rs≠0
α=0.05
(2)编秩、求秩和
分别编秩
每个变量中若有相同的观测值则【取平均值】
(3)计算检验统计量
(4)确定P值,做出统计推断
拒绝原假设时,认为...有相关关系,且相关关系为正/负
3、线性趋势检验
资料类型:双变量有序分类资料
基本思想
①将R×C表卡方值分解为【线性回归分量】与【偏离线性回归分量】两部分
②若【两个分量都有统计学意义】一可以推断两个分类变量存在相关关系,但不是简单的直线关系
③若【线性回归分量有统计学意义,偏离线性回归分量无统计学意义】→可以推断两个分类变量不仅存在相关关系,而且是线性关系
2、区组设计资料的秩和检验——Friedman秩和检验
1、概述
Friedman的M统计量之核心部分也是秩次的组间变异与总变异之比。显然,M越大,说明组间变异越大,反之亦然。当有相同等级时,按式(8.9)校正。
注意,在只有两个处理组时,Friedman的M检验并不与配对的Wilcoxon符号秩和检验等价。事实上,Friedman的M检验效能相对较低。
2、检验步骤
建立检验假设,确定检验水准
H1:各处理组对应的总体的分布相同
H1:各处理组对应的总体的分布不全相同
α=0.05
计算检验统计量M值
①编秩
在每一个区组内(不是区组间),将数据由小到大依次编秩;
若相同数据,取平均秩次
②求秩和:将各组秩次相加
③计量M值
M界值表法
k(处理组数)≤4,b(区组数)≤15
卡方界值表法
k>4,b>15,,M近似服从v=k—1的X²分布
如有相同秩次,且M按近似X²分布进行统计推断时,需采用校正公式:
确定P值,作出统计推断
P>α,不拒绝H0,即各总体分布相同
P≤α拒绝H0,接受H1;即各总体分布不全相同
3、两两比较(q检验法)
(1)建立检验假设
H₀:所比较的两个总体分布相同;
H₁:所比较的两个总体分布不同。
α =0.05。
(2)求各秩和,两秩和之差
(3)计算检验统计量
式中RA-RB为两对比组的秩和之差
nA与nB为样本含量;k为处理组数;N为总例数;
式中分母为S(RA—RB)的标准误
(4)确定P值,做出推断
(二)相关与回归——双变量分析
第10章+11章 两指标间的直线相关与回归
一、相关
一、简单线性相关
(一)定量资料的相关——Pearson直线相关系数
1、概述
1、定义
又称Pearson积矩相关系数,
用来描述两个定量变量间线性关系的密切程度与相关方向的统计指标。
总体相关系数,通常记作ρ。描述全体研究对象的两个变量之间线性相关
样本相关系数,通常记作r。描述两个样本资料的两个变量之间线性相关
2、线性相关的分类
①正相关
两个变量的大多数观察值【具有同时增大或同时减小】的直线变化趋势
②完全正相关
样本中所有的点【都集中在一条斜率大于0】的直线上
③负相关
两个变量的大多数观察值具有[一方增大/减小而另一方减小/增大相反]的变化趋势
④完全负相关
样本中所有的点【都集中在一条斜率小于0】的直线上
⑤零相关
X和Y之间【无任何直线变化趋势】
⑥非线性相关
呈现【某种曲线相关】
3、应用
(1)前提条件
①当两变量X,Y有线性趋势时(散点图),才能进行线性相关分析
②适用于(两变量均为随机取值)(双变量正态分布)的资料
(2)注意事项
①满足双变量正态分布且有线性趋势时(散点图),才能进行相关分析
②相关关系是一种共变关系,不一定是因果关系
③谨慎对待离群值
④分层资料【盲目合并容易引起假象】
4、解释直线相关系数时需注意
①直线相关要求两个变量均为定量变量。
②r的计算去掉了量纲的影响,本身没有单位,只是一个数值。
③直线相关只衡量两个变量之间线性关系的方向和密切程度,而不能描述其他情形的关系,如曲线关系。
④与均数和标准差一样,相关系数受离群点的影响,当散点图中出现离群点时应慎用相关。
⑤相关系数不是对两变量数据的完整描述。在给出相关系数时,还应给出两变量的均数和标准差。
⑥相关无需特别区分解释变量和反应变量。
5、相关分析方法选择
①定量资料
①x、y服从双变量正态分布
直线相关分析
②x、y不服从双变量正态分布
Spearman秩相关
②分类资料(R×C表)
①双向无序
列联表的独立性2检验+Pearson列联系数
②双向有序、属性不同
Gamma检验、线性趋势检验
③双向有序、属性相同
一致性检验(Kappa检验)
2、Pearson积差相关系数的计算
①公式
②r的意义
①r的正负值表示两变量之间线性关系的方向
①r为正表明变量之间呈正相关,为负表明呈负相关。
②r取值范围在[-1,1],没有单位
②r的绝对值表示两变量之间线性关系的密切程度
①r值接近于0说明线性相关弱。
②r取值由0接近1或者-1,关系密切程度增高。
③r值趋近于1或者-1说明各个点与直线的距离很近。
④只有散点图中所有点恰好落在一条直线上,才会出现极端值1或-1。
Pearson直线相关系数和Spearman秩相关系数区别与联系
(1)区别
Pearson直线相关系数
①适用情形
要求数据服从二元正态分布,属于参数统计量
②本质
基于原始数据进行统计分析
③假设检验
是参数检验的假设检验方法
Spearman秩相关系数
①适用情形
适用于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料,属于非参数统计量
②本质
将原始数据进行秩变换后进行统计分析。
③假设检验
为非参数检验的假设检验方法
(2)联系
①两者所解决的问题相同,都可用来表示两变量间线性相关的方向与密切程度。
②两个相关系数都没有单位,取值范围都在[-1,1]之间。
③计算上,相关系数的含义、单位、取值范围一致,且计算公式相同,不同的是一个直接用原始的定量数据,另一个则要用等级数据。
④两者都要求个体间满足独立性。
(二)等级资料的相关——Spearman秩相关系数
1、相关概念
(1)Spearman秩相关系数
又称等级相关系数,
主要用来描述当两变量中有一个为等级变量时,
或无法用均数和标准差描述其分布特征时两变量间关联的程度方向。
(2)秩或秩次
将数据按从小到大进行统一排列,排序的结果称秩或秩次
(3)相持
排序时出现数据相等,造成秩次相同的现象称相持,此时计算平均秩次为其秩次
2、应用条件
①不服从双变量正态分布
②任何一个变量不满足正态分布、或总体分布类型未知
③或原始数据是等级资料等级资料
④或无法用均数和方差描述其分布特征时(非正态分布)
⑤有一个变量为有序分类变量
3、计算步骤
编秩
①将观测值从小到大排序编秩pi、qi,遇相持时取平均值。
②分别计算pi、qi的均数和标准差。
③把秩次带入直线相关系数计算公式。
公式
取值
[-1,1],没有单位
意义
(1)r的正负值表示两变量之间线性关系的方向。
(2)r的绝对值表示两变量之间线性关系的密切程度。
4、注意
①秩相关系数实质上也是直线相关系数,取值范围也是[-1,1],秩相关系数的公式表明其含义与直线相关系数完全相同。
②根据散点图和相关系数开展的相关分析,均未区分反应变量与解释变量
(三)定性资料的相关——Pearson列联系数
1、交叉表(或列联表)的制作
(1)2x2交叉表的相关分析
由两行两列构成的表格可称作2*2交叉表。一般将解释变量x作为列变量,反应变量y作为行变量。
Pearson列联系数
用于两分类变量的关联一般采用Pearson列联系数r来反映。r取值在[0,1)。
列联系数是否为0的假设检验=构成比是否相同的假设检验。
(2)行×列表资料的相关分析
表示行×列表资料的相关关系的列联系数种类很多,其中Cramér修正列联系数V较适合于描述定性资料的相关
其公式为
行×列表资料的列联系数是否为0的假设检验=行×列表构成比是否相同的x²检验相同
2、条件分布与关联
1、联合分布
两个分类变量的所有单元格的构成比组成了这两个分类变量的联合分布。(每个单元格构成比可用其中的数值除于总样本量)
2、边缘分布
交叉表中单个变量的分布称为该变量的边缘分布。在双变量交叉表中,共有两个变量,所以有两个边缘分布。(如性别边缘分布为各男女样本数除于总数样本)
3、条件分布
在设定一个变量取值的条件下,计算另一个变量取值的分布,所得到的分布就是条件分布。(例如,男童维生素D缺乏的条件分布=缺乏男生人数/男生总人数)
二、直线相关系数的统计推断
(一)Pearson直线相关系数
一、总体相关系数的置信区间估计
(1)一般情况下(ρ≠0时),r的抽样分布并不对称,需要对ρ作变换后得到的zr具有近似正态性,可用于后续统计推断。
(2)转换公式
zr近似服从均数为
标准差为1/Ön-3的正态分布
(3)zρ的1-a置信区间计算公式为
二、ρ=0的假设检验
(一)查表法( n ≤50时)
根据自由度 v=n -2,査 r 界值表,比较统计量|r|与界值,
统计量绝对值越大, P 值越小;
统计量绝值越小, P 值越大。若|rs|超过界值,则可以拒绝H0。
(二)t检验( n >50时)
①建立检验假设,确定检验水准
H0:ρ =0,即两变量间无直线相关关系。
H1 : ρ ≠0,即两变量间存在直线相关关系。
a=0.05。
②计算检验统计量t
Sr为样本相关系数的【标准误】
H₀成立时,tr服从自由度为v=n-2的t分布。
③确定 P 值,作出推断
① P ≤0.05,拒绝零假设,两变量间的直线相关性有统计学意义,可认为两变量之间存在直线相关。
②P >0.05,则不拒绝零设,两变量间的直线相关性无统计学意义,尚不能认为两个变量之间存在直线相关。
三、应用
1、应用条件
①当两变量有线性趋势时,才能进行线性相关分析
②直线相关分析要求两个变量服从二元正态分布
③相关分析适用于两变量均为随机取值的资料,当一个变量的数值是人为选定时不能作相关分析。
2、应用时的注意事项
(1)相关关系不等于因果关系。有无因果关系还需从专业角度作进一步研究。在作线性相关分析前应该绘制散点图,以便作出正确的判断。
(2)当观察例数较少时,相关系数容易受个别特殊值所影响,故不稳定。因此,需事先做好试验设计,正确确定样本含量。
(3)样本相关系数接近于0并不意味着两变量间一定无相关性,也可能在在非线性(曲线)关系。
(4)应区别相关有统计学意义与相关强度
①反映两变量关系密切程度应该是相关系数的绝对值,
②相关系数r经假设检验有统计学意义且得到非常小的P值,P 值越小只能说越有理由认为两变量间直线关系存在,只能定性回答两变量是否存在直线相关,而不能说关系越密切或越“显著”。
③若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数ρ的置信区间来说明。
(二)Spearman等级相关系数的假设检验
①建立检验假设,确定检验水准
H0:rs=0
H1:rs≠0
a=0.05
②计算检验统计量t
编秩
①将观测值从小到大排序编秩pi、qi,遇相持时取平均值。
②分别计算pi、qi的均数和标准差。
③把秩次带入直线相关系数计算公式。
公式
③确定P值,作出推断
当n<50时,直接查rs界值表
当n≥50时,查t界值表
二、回归
一、一个自变量——简单直线回归
一、概述
1、简单线性相关与回归
一、回归直线的拟合
1、回归直线
①定义
描述反映变量y,如何随解释变量x改变而改变的直线称回归直线。
常用于预测一个给定x值条件下的y值大小。
②变量X有两种→两型回归
I型回归
X是精确测量和严格控制的变量;
Y为随机变量,X为非随机变量—II型回归
Ⅱ型回归
X、Y均是随机变量—I型回归
Ⅱ型回归对资料的要求与直线相关相同,X、Y均为随机变量且服从双变量正态分布
若作回归分析,可以计算两个独立的回归方程
2、回归方程
(1)定义
刻画回归直线的方程称为回归方程。
(2)作用
拟合的回归方程能简洁地描述反应变量y对解释变量x 的数量依存关系(定量描述),这种数值化概括是对散点图(定性描述)的定量补充。
(3)解释
①专业角度
因变量与自变量之间有数量依存关系
②统计学角度
判断构建的回归方程是否有统计学意义
(4)回归中的两个变量
①反应变量(因变量)
对研究结局的测量,又称结局变量,通常用y表示;
②解释变量(自变量)
解释或者引起反应变量改变的变量,通常用x表示;
一般的关系是自变量影响应变量,或说应变量依赖于自变量
3、直线回归
(1)定义
是利用数理统计中的回归分析,
来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
(2)直线回归方程与模型
①直线回归方程
②直线回归模型
③样本估计的回归方程
(3)回归方程中各函数的意义
①^Y表示按回归方程所求得的估计值
①当X固定时,Y的总体均数μY|X的估计值。表示当X每改变一个单位时Y^的改变量
②Y^的涵义
是均数,是在不同X时,Y均数的估计值,由回归方程估计得到的,故又称条件均数
③计算
即Y估计值之均数等于Y观察值之均数。
且当自变量X=`X时,Y的估计值等于`Y。
②a为回归直线在Y轴上的截距
①表示x= 0时,y^的值
②单位与y相同
③b为回归系数,即回归直线的斜率
①b的取值
b>0,表示Y随X的增加而增加;
b=0,表示回归直线与X轴平行,即X与Y无回归关系。
b<0,表示Y随X的增加而减少;
②单位与x、y有关
③回归系数b与相关系数r的正负号是相同的
④b与r的假设检验是等价的
⑤b与r的换算关系
④(Y-Y^)
称为剩余,又称剩差,是Y的观察值与对应的估计值之差,
即所有剩余之和为0。
当Y-Y^>0时,对应的散点在回归直线之上方;
当Y-Y^<0时,对应的散点在回归直线之下方。
直线上方的点到回归直线纵向距离之和=直线下方的点到回归直线纵向距离之和
⑤∑ (Y-Y^)²
所有剩余之平方和,称为剩余平方和,可用lxx,lyy及lxy表示
因变量实际值与估计值之差的平方的总和,
也即在总平方和中无法用回归关系解释的部分,表示考虑回归关系之后y的变异。
反映了除了x对y的回归关系影响之外的所有一切因素对y的变异的作用,
4、直线回归方程的建立→最小二乘法(LS)
(1)目的
找到一条尽可能靠近所有点的直线,
即使拟合直线与数据的纵向差距的平方和最小
(我们关心的是纵向差距,y反应变量的点与直线的残差或差距)。
(2)应用
由样本资料决定回归线时,
应用[最小二乘法]原理,求解a和b两个系数(a和β的点估计值)
(3)基本原理/基本思想
使各实测值Y与回归直线上的(纵向距离)对应的估计值Y^之差的平方和 ∑ (Y-Y^)²最小,即残差平方和最小,记为SS残差,
(4)公式
lxx:x的离均差平方
lxy:x与y的离均差积和
(5)注意
(1)相关系数与斜率有紧密的关系
斜率的表达式
也称回归系数,有单位,取值范围(-¥,+¥)
表示回归直线上x每改变1个标准差,对应的y^就会改变r个标准差。
当变量间完全相关(r=1或r=-1)时,反应变量预测值y^的改变量与x的改变量相同(以标准差为单位);
当-1<r<1时,y^的改变量就小于x的改变量,因为如果相关性减弱,x的改变引起的预测值y^的改变就减少。
(2)最小二乘回归直线是以
为斜率,过点(`x,`y)的直线,若纵坐标、横坐标均是从原点(0,0)开始,
将此线左端延长与纵轴相交,交点的纵坐标必等于截距a。
这两点可以用来核对图线绘得是否正确。
我们可以基于最基本的描述性统计量`x,`y、sx、sy、r来计算回归方程。
(3)最小二乘法回归只关注y方向上点到直线的纵向距离,变量x和y在回归中作用不同,交换解释变量与反应变量后结果将改变,因此在构建回归方程时,解释变量和反应变量需根据研究目的进行设定。
(4)所作回归线一般不宜超过样本的自变量取值范围,因为所建回归直线是依据样本的,在样本的自变量取值范围外,两变量间的关系是否还属直线关系,尚不清楚。因此应该避免直线外延。
二、回归方程的解释及残差
1、回归方程的解释
①常用于预测一个给定x值条件下的y值大小。
②刻画回归直线的方程称为回归方程,表示为y^=b0+b1x,其中y^是x相对应的y的预测值;b1是斜率,表示当x每改变一个单位时y^的改变量。b0是截距,表示x=0时y的值。
③拟合的回归方程能简洁地描述反应变量y对解释变量x的数量依存关系,这种数值化概括是对散点图(图形化概括)的定量补充。
④最小二乘法回归直线的斜率和截距与测量单位有关,不能仅凭它们的大小判断其影响大小。
⑤可以用回归直线预测一个给定的解释变量x值对应的y值,但回归直线概括了整体趋势,给出的预测值也是整体趋势的预测,不一定完全正确。
2、残差
(1)定义
反映的是变量的观测值与基于回归直线的预测值之间的差异,
即残差ei=观测值yi-预测值y^i。
(2)残差图
是残差相对于解释变量或反应变量预测值的散点图,
可以帮助我们评价回归直线于散点的接近程度。
直线与散点的接近程度较好的残差图应呈现为一条无规律且集中于0的水平带。
如果回归直线的残差不是均匀分布于0水平线附近,说明直线的拟合效果不好。
(3)注意
①误差:是观测值与真实值的偏离。
②残差:是观测值与拟合值的偏离。
(4)残差分析→标准化残差图
A、模型与数据拟合得较好
当标准化残差图中散点的分布绝大部分在士2倍标准差之间。
B、离群点
土2倍标准差以外、士3倍标准差以内区域出现的点所对应的原始数据可能为离群点
三、决定系数与相关
1、决定系数r²
在反应变量y的总变异中,r²表示用y和x的最小二乘法回归关系所能解释的比例。
r²=S²y^/S²y(决定系数=预测值方差/观测值方差)。
2、意义
①说明反应变量y的总变异归功于x的部分。
②取值在0 ~1之间,无单位。
③完全相关(r=1或=-1) 表示所有的点刚好全部位于直线上,r²=1,即一个变量的全部变异都可以通过与另一个变量间的直线关系来解释。
④r²可以反映回归拟合的实际效果
⑤回归直线可以解释r²的大小,能衡量相关关系的强度
3、与回归有关的两个系数
决定系数
①符号表示
②含义
反映回归拟合的实际效果
③取值范围
[0,1]
回归直线斜率(回归系数)
①符号表示
②含义
表示回归直线上x每改变一个标准差,对应的y估计改变r个标准差
③取值范围
(-∞,+∞)
2、直线回归的统计描述
(1)绘制散点图
概念
将两变量置于直角坐标轴上,把其中一个变量取做X,另一个取做Y,据此在直角坐标系中标出对应的点(X,Y)得到的图形
目的
①判断两变量间【有没有线性趋势】/【是否可能存在直线】
②检查是否存在【异常点(outlier)】,即对应于残差绝对值特别大的观测数据
(2)求回归系数和常数项
回归系数的估计
常数项的估计
a=`Y-b`X
构建直线回归
Y^=a+bX
3、直线回归与直线相关的区别及联系
1、区别
1、直线相关
①资料要求
两个变量x、y服从双变量正态分布
②应用
用于刻画两个定量变量间的直线关系的方向和强度,无需区分反应变量与解释变量
说明两变量间的相关关系
③意义
r说明具有直线关系的两个变量间关系的密切程度与相关方向
④计算
⑤取值范围
-1≤r≤1
⑥单位
r没有单位
4、相关与回归的关系
(1)相关系数
(2)回归
(3)当研究更关注两个变量之间的数量依存关系时,此时两个变量不再对等,
(4)举例说明
肥胖和心理健康关系的研究
A、相关:用于了解肥胖与心理健康之间的关联情况。
B、回归:用于根据现有肥胖数据预测心理健康水平解释肥胖对心理健康的影响。
2、直线回归
①资料要求
固定X,因变量Y服从正态分布并且等方差或者残差服从正态分布并且等方差。
X是可以精确测量和严格控制的变量,也可以是随机变量。
②应用
在进行回归分析之前,先要确定两个变量之间存在一定的相关性(无相关,不回归)
有了反应变量与解释变量之分;
说明两变量之间的依存关系
③意义
b表示x每增(减)一个单位时,y平均改变b个单位
④计算
⑤取值范围
-¥<b<+¥
⑥单位
b有单位
2、联系
(1)严格来讲
相关分析包括了回归分析,确定变量之何是否存在关系,是二者实同的起点。
(2)在符号上
相关系数与回归系数的符号是一致的。
对同一数据同时计算r和b,其符号一致
(3)假设检验
相关系数与回归系数的假设检验是等价的。
对同一样本,其tb=tr,
(4)在解释上
利用决定系数R²,可以用回归解释相关。
R²=r²=SS回归/SS总,决定系数越大,回归平方和越接近总平方和,
说明构建的回归方程越好,两变量间的相关关系越密切。
(5)系数换算
(6)相关系数与回归系数的标准误Sb的关系
由tr=tb,得到
相关程度越高,r²越接近1,
回归系数的标准误Sb就越小,回归系数估计的平均抽样误差就越小。
二、直线回归的统计推断
一、回归模型与参数解释
1、概述
①简单直线回归模型
假设y的观测值服从一系列随解释变量x而变化的正态分布,
其连续变化的均值取决于x值。
②总体回归直线
①定义
当解释变量x的值固定时,反应变量y服从均数为μy的正态分布。
用刻画两变量之间的数量依存关系,总体回归直线如下
②公式
μy
表示x取某个数值时所对应的y的条件总体均数,
随着x取值的变化而变化。
β0
总体回归直线的截距或常数项。
β1
总体回归直线的斜率或回归系数,
表示 x改变一个单位时y的平均改变量
③y的个体值与其总体均数的关系
关系
ei为残差,ei~N(0,σ²)
解释
在直线回归中,假设每一个x所对应的μy都在回归直线上,
由于个体观测值不一定总等于其均数,所以在回归直线分析中存在误差
2、回归模型
1、总体线性回归模型
Y:应变量
X:自变量
μY|X:X所对应的Y的总体均数
a:回归直线的截距
β:回归直线的斜率,又称为回归系数
直线描述了条件总体均数μy随着x取值的变化而变化。
4 个正态分布曲线反映了反应变量y随着解释变量x的4个不同取值而有所不同。
2、样本回归方程
Y^:X所对应的Y的总体均数μY|X的估计值
a:常数项,是截距α的估计值
b:样本回归系数
是总体回归系数β的估计值。
表示当X变化一个单位时,Y平均增加或减少的估计值
二、β1的置信区间估计和假设检验
1、概述
样本回归系数不等于0并不一定表示总体中两变量一定存在回归关系。
如图11-3所示,从β₁=0的总体中随机抽样得到一个样本,
由于抽样误差的存在,其样本回归系数b₁=0.413,不等于0。
故推断总体中两变量是否存在回归关系,
还需要对总体回归系数β₁是否不等于0进行统计推断。
2、假设检验
(一)β1的置信区间
tα/2,(n-2):自由度v=n-2的双侧t界值,
Sb₁:样本回归系数b₁的标准误,
Sy·x:残差的标准误。指扣除x对y的影响后,y对于回归直线的离散程度。
(二)β1=0 的t检验
①建立检验假设,确定检验水准
H0:总体回归方程不成立(β1=0)
H1:总体回归方程成立(β1≠0)
α=0.05
②计算检验统计量t
Sb:表示样本回归系数的标准误
①SY·X表示去除X影响后Y的变异程度,即剩余标准差/残差标准差
②度量了实际散点远离回归直线的离散程度,反映了模型的可靠性。(越小模型越好)
③确定P值,作出推断(根据t0.05/2,v查表)
P≤0.05,则两变量之间存在直线回归关系:
P>0.05,则两变量之间不存在直线回归关系。
(三)回归系数的方差分析的步骤
(1)回归方程的F检验
①建立检验假设,确定检验水准
H0:总体回归方程不成立(β1=0)
H1:总体回归方程成立(β1≠0)
α=0.05
②计算检验统计量F
③确定P值,作出推断
根据Fα(V回归,V残差)查表
①P≤0.05,两变量间存在直线回归关系。
②P>0.05,尚不能认为两变量间存在直线回归关系。
(2)应变量总变异的分解
SST=SSR+SSE
对于β₁是否不为0的方差分析恰好就是两组均数是否不等的假设检验。
理解回归系数假设检验中方差分析的基本思想,需要分解反应变量y的离均差平方和与自由度,如图11-5所示。
在图11-5中,任意一点a(x,y)的纵坐标被回归直线与均数y截成三段,
其中:y-`y=(y^-`y)+(y-y^)。由于点a是散点图中任取的一点,若将全部数据点都按上法处理,并将等式两端平方后再求和,则有
SS总=SS回归+SS残差
①SS总——总离均差平方和
计算公式
意义
表示因变量Y的总变异为Y的离均差平方和
即不考虑y与x的回归关系时y的总变异。
②SS回归——回归平方和
计算公式
意义
因变量估计值与平均值之差的平方的总和,
反映了在y的总变异中可以用y与x的回归关系所解释的部分,
即y的总变异中由于y与x的回归关系而使y的总变异减少的部分。
SS越大,说明回归效果越好。
③SS残差——残差平方和
计算公式
意义
因变量实际值与估计值之差的平方的总和,
反映了除了x对y的回归关系影响之外的所有一切因素对y的变异的作用,
也即在总平方和中无法用回归关系解释的部分,表示考虑回归关系之后y的变异。
SS越小,直线回归的拟合越好。
①与组间均数比较的方差分析对比,两个检验的总自由度都是n-1(y的自由取值个数n减去μy这1个参数个数)
②回归的自由度是其平方和∑(y^-`y)²中所含参数个数的差值决定的,对应其中前一项所含的β₀与β₁两个参数,减去对应后一项中一个参数μy,所以自由度为1。
③残差自由度因其平方和∑(y-y^)²中暗含β₀与β₁两个参数,故其自由度为n-2。
①反应了Y的总变异中回归关系所能解释的百分比,取值在0-1之间,且无单位
②决定系数越大,说明回归方程解释的变异越大,构建的回归方程越好
(四)两个斜率的比较
1、概述
①对两条回归直线的斜率进行比较,即比较β₁与β₂是否相等,用以说明在不同的资料中,自变量对应变量的线性影响或作用是否相同。
②对两个斜率进行比较前,首先需确认两条回归线是否成立。如果两条回归线均成立,即β₁≠0,且β₂≠0,则可以进一步比较两个斜率是否相等。否则没有必要作进一步比较。
2、检验步骤
①建立检验假设,确定检验水准
H₀:β₁=β₂,即两总体斜率相等;
H₁:β₁≠β₂,即两总体斜率不等。
α=0.05
②计算检验统计量t
Sb₁-b₂为两回归系数之差b₁-b₂的标准误
lx₁x₁,lx₂x₂分别指两样本自变量的离均差平方和,
(S²Y·X)ω为两样本剩余均方之加权平均,又称合并剩余均方
③确定P值,作出推断(根据t0.05/2,v查表)
P≤0.05,则两总体斜率相等:
P>0.05,则两总体斜率不等。
(五)两条回归直线的合并
1、概述
1、分析的思路
①首先要确认两条回归线都是成立的,即β₁≠0,且β₂≠0。否则没有必要作进一步比较
②其次比较两条回归线是否平行,即比较斜率β₁是否等于β₂,若β₁≠β₂,则没有必要作进一步分析;
③如果两条回归线平行,那么用公共的斜率重新建立回归方程,并进一步检验两条平行的回归线之高度是否相等,即在同一个X,Y₁是否等于Y²。只有当两条回归线平行且高度相等,两条线才可能重叠。
2、两条平行的回归线的高度之差定义为
两条平行的回归线分别
对任意一个X₁=X₂=X,两个回归方程Y的估计值之差
在回归图中,h是两条回归线的纵向距离。
3、注意
因直线回归往往是曲线回归在一定的自变量取值范围内的局部表现,故两回归方程合并尚需两组自变量的取值范围大致相同。当两组自变量的取值范围有明显的偏离时,即使两回归直线斜率和高度均相同,其合并也难以实现。
2、检验步骤
①建立检验假设,确定检验水准
H₀:两总体回归线的高度相等;
H₁:两总体回归线的高度不等。
α =0.20
②计算检验统计量t
公共回归系数
公共剩余均方
自由度为:v=n₁+n₂—3
③确定P值,作出推断(根据t0.05/2,v查表)
P≤0.05,则两总体回归线的高度相等
P>0.05,则两总体回归线的高度不等
三、回归直线的预测(置信带和个体值的预测带)
1、概述
1、回归直线的置信带
以x为横坐标,y为纵坐标,将置信区间的上下限分别连起来形成的两条弧形线间的区域,称为回归直线的置信带
当xp=`x时,反应变量总体均数的标准误达到最小值Sy.x/Ön,其对应的置信带最窄。xp离`x越远,其标准误越大,对应的置信带越宽。
2、y值的预测带
以x为横坐标,y为纵坐标,将预测区间的上下限分别连起来形成的两条弧形线间的区域,称为y值的预测带。
同样,y值的预测带也是中间窄、两头宽,在xp=`x处最窄。
3、总体回归线的95%置信带与个体值y的95%预测带均由对称于回归线的弧形曲线构成,后者比前者更远离回归线。
2、反应变量平均值μy^的置信区间
①应用
反应变量的总体均数置信带
②含义
在x为一定值时,反复抽样100次,获得100个样本,可以算得100个置信区间,其中有100(1-α)个置信区间包含应变量的总体均数。
③公式
(1)点估计
(2)区间估计
④本质
置信区间
⑤对应分布
抽样分布
3、反应变量个体值Y的预测区间
①应用
应变量的个体值预测带
②含义
在x为一定值时,随机抽取100个个体,有100(1-α)个个体值在此范围内。
③公式
④本质
参考值范围
⑤对应分布
总体分布
四、应用条件及判断方法→前提条件——LINE
线性
①反应变量与解释变量之间呈直线关系;即因变量 Y 的总体平均值与自变量 X 呈线性关系。通过绘制散点围可以判断 Y 与 X 的线性回归关系是否有可能成立。
独立
②各观测值相互独立;通常可以利用专业知识或经验来判断这项定是否成立。
正态
③解释变量固定时所对应反应变量服从正态分布;可通过直接对残差作正态性检验或止态概率图来检验这一条件是否成立。样本重较大时,可忽略残差的正态性要求
方差齐
④不同解释变量取值下反应变量的条件方差相等,即 方差齐。是指在自变量 X 的取值范围内,不论 x 取竹么值, Y 都具有相同的方差,等价于残差的方差齐性。通常可采用( Xi ,Yi)散总图或残差的散点图判断该设的正确性。
五、线性回归分析注意事项
(1)简单线性回归分析要有实际意义,不要把毫无关联的两种现象强加在一起作回归分析。
(2)在作线性回归分析前,一定要绘制散点图,观察全部数据点的分布趋势,只有存在线性趋势时,才可以进行线性回归分析。
(3)线性回归方程的适用范围一般以自变量的取值范围为限,若无充分理由证明超过自变量取值范围仍是直线,应该避免外延。
(4)作线性回归分析有统计学意义不等于有实际意义,考察线性回归方程的拟合优度常用决定系数 R2的大小,而不是线性回归分析的假设检验的概率P值
(5)双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大
(6)相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。
六、回归分析的正确应用
①描述两变量之间的直线回归关系
②统计预测
总体均数μY/X的区间估计——置信带
个体Y值的容许区间估计——预测带
③统计控制
④回归分析的方法选择
①因变量为连续型定量变量,服从正态分布
一个因变量,一个自变量→直线回归分析
一个因变量,多个自变量→多重线性回归分析
②因变量为定性变量,结局
Logisticl回归分析
③因变量为含有截尾数据的生存数据,结局+生存时间
Cox比例风险回归分析
二、多个变量——多重线性回归
第一节多重线性回归️反应变量为定量变量(正态)
1、概述
(1)概念及基本形式、特点
①定义
是研究一个连续型反应变量和多个解释变量间线性关系的统计学分析方法。
②基本形式
Y^为应变量的估计值
X₁,X₂,…,Xm为自变量,m为自变量个数,
a为回归方程的常数项
b₁,b₂,…,bm为偏回归系数,简称为回归系数
如b₁表示在X₂,X₃,…,Xm固定条件下,X₁每增加一个单位,Y平均改变b₁个单位,
即b₁反映了X₁对Y的“净”的效应或称局部效应,偏回归系数由此得名。
③特点
①具有直线回归的基本性质
②可以进行多因素分析
③可提高回归方程的估计精度,增强方程的预测预报能力和统计控制效果。
(2)目的和作用及其分析步骤
①目的
是用若干个解释变量x₁,x₂,…、xp的数值估计反应变量y的平均水平
μy表示模型中解释变量取值固定时反应变量y的总体均数;
p为解释变量个数;β₀为常数项;
②作用
①某个解释变量对反应变量是否有作用及每个解释变量对反应变量作用的大小;
②反应变量与所有解释变量之间的关系有多强;
③结合专业知识确定某个解释变量是否为混杂因素等。
③步骤
①用所有自变量和应变量建立回归方程。
②对总的回归方程进行线性假设检验,当总的方程没有统计学意义时,表明所观察的自变量与应变量不存在线性回归关系,也可能由于样本例数太少或遗漏了与应变量有关的重要的自变量。
③当总的方程有统计学意义时,应对每个自变量的偏回归系数再进行假设检验,若某个自变量的偏回归系数没有统计学意义,则应将该变量剔除,重新建立不包含该自变量方程。
(3)相关概念
(1)复相关系数R
又称多重相关系数,符号为R,
用于说明所有自变量(X₁,X₂,…,Xm)与应变量Y之间的线性回归关系的密切程度。
R的值介于0和1之间,它与简单相关系数r不同,没有负值。
R值越接近1,相关越密切,R值随引入回归方程内的变量个数增加而增加。
复相关系数的平方R²,亦称决定系数,其意义与r²相同,R²=SS回/SS总。
R²越接近1,说明引入回归方程中的自变量与应变量相关的效果越好。
复相关系数的假设检验等价于多重回归方程假设检验,均用方差分析,所得结果相同
(2)校正复相关系数Radj
用Radj表示,其意义与复相关系数相似,复相关系数随方程中变量数的增加而增加
即使没有统计学意义的变量进入方程,其值亦增加,
因此用复相关系数的大小作为衡量方程好坏的标准似有欠缺。
校正复相关系数就是针对这一现象提出的对复相关系数的一种校正,
当方程中增加没有统计学意义的变量时,校正复相关系数就会减少。
常用来作为衡量方程好坏的标准之一。
(3)剩余标准差sy·x₁…m
用sy·x₁…m表示,与直线回归相似,剩余标准差是表示回归方程估计精度的指标。
一般它随回归方程中的自变量增加而减小,
但删除某些无统计学意义的自变量后反而减小,这一性质与校正复相关系数相似。
也说明了使用多重回归分析并非变量越多越好。
在使用多重回归进行预测或控制时,需使用剩余标准差计算估计值Y^的标准误SY^
及个体Y值的标准差SY,以计算估计值Y^的可信区间及个体Y值的容许区间。
(4)偏回归系数(βj)
βj为解释变量xj的偏回归系数,表示当方程中其他解释变量保持不变时,
解释变量xj变化一个单位,反应变量y平均变化βj个单位,
βj的符号也可用于判断解释变量xj对反应变量的方向。
由样本估计得到的多重线性回归方程如
(5)标准化偏回归系数(β'j)
①定义
由于各变量量纲可能不一致,
多重回归模型的各偏回归系数的数值大小比较其对反应变量y的影响大小。
用标准化的数据拟合回归模型,此时得到的回归系数称为标准化偏回归系数。
标准化偏回归系数b'j与普通偏回归系数bj的关系式为
②进行标准化的原因
因P个解释变量都具有各自的计量单位以及不同的变异程度,
不能直接用偏回归系数的数值大小比较方程中各个解释变量对反应变量y的影响大小
可首先将原始观测数据进行标准化,即
③意义
①消除了变量的量纲及其离散程度的影响,其绝对值可用来比较各解释变量反应变量y的影响大小。
②标准化偏回归系数绝对值越大的解释变量在数值上对反应变量y的影响越大。
2、参数估计及假设检验
(—)参数估计
采用最小二乘法估计未知参数,
即使得反应变量的观测值y和估计值y^之间的残差(y-y^)平方和取最小值时的b作为相应β的估计值。
(二)假设检验
1、回归模型的方差分析
计算获得回归系数的样本估计值b₁,b₂,…,bp之后
需进一步检验是否可以拒绝H0:β1=β2=β3=0,以确定回归方程是否有统计学意义
2、偏回归系数的t检验
在回归方程具有统计学意义的情况下,
检验某个总体偏回归系数是否等于零,以判断某个解释变量在数据中是否有作用
若检验:H0:βj=0,H1:βj≠0,类似于简单线性回归的情形,
其检验统计量为
sb为第j个偏回归系数的标准误
标准化偏回归系数提示每个解释变量对反应变量作用的大小
3、决定系数r²
①和简单直线回归一样,回归平方和在总平方和中所占百分比称为决定系数,记r²
②r²=SS回/SS总,0≤r²≤1
③r²接近于1,表示所选用的线性回归模型很好地拟合了当前的样本数据
④基于决定系数对回归方程进行拟合优度的假设检验等价于对回归方程的方差分析
4、复相关系数
决定系数的平方根称为复相关系数,
表示变量y与p个解释变量 ((x₁,x₂,…,xp)的线性相关的程度
3、解释变量的筛选
①目的
使得模型中尽可能保留对回归贡献较大的重要变量,
而不包括对回归贡献较小的变量
尽量用简洁的模型,达到尽可能高的估计精度。
通过对解释变量的筛选,建立“最优回归方程”。
②“最优回归方程”
①对反应变量y有统计学意义的解释变量,全部入选回归方程;
②对反应变量y无统计学意义的解释变量,都未入选回归方程。
③选择“最优回归方程”的方法有
①最优子集回归法
①定义
在全部解释变量所有可能组合的子集回归方程中,挑选最优者
②缺点
这样所选结果最优,但计算量极大。
③适用情况
适用于自变量个数不太多的情况。
②向后剔除法
先建立一个包含全部解释变量的回归方程,
然后按照某种规则(如P值最大且无统计学意义)每次剔除一个解释变量,
直到不能剔除时为止。
③向前引入法
回归方程按照某种规则(如P值最小且有统计学意义)每次引入一个解释变量,
由少到多,直到无可引入的解释变量为止。
④逐歩筛选法
取上述向后剔除法、向前引入法两种方法的优点,
在向前引入每一个新解释变量之后,
都重新检验前面已选入的解释变量有无继续保留在方程中的价值。
引入和剔除交替进行,直到既没有具有统计学意义的新变量可引入,
也无失去其统计学意义的解释变量可剔出方程为止。
4、用途及注意事项
(1)用途
①影响因素分析
①对每个变量的偏回归系数的检验及变量的筛选,可获得影响反应变量所有的因素
②校正或平衡其他因素后,可以对某单个因素的作用进行解释;
③利用偏回归系数可以得到每个因素的作用大小及方向;
④利用标准偏回归系数可 以比较各因素对反应变量相对贡献的大小。
②估计与预测
①基于建立的最优回归方程,确定各解释变量和反应变量的数量关系,
②根据较易测得的解释变量来推算不易测得的反应变量。
③可以根据各解释变量的取值,预测反应变量平均值的置信区间
(2)注意事项
①多重共线性问题
①回归系数的抽样误差即标准误增大,使得有统计学意义的变量变得无意义;
②使回归系数估计值大小发生改变,甚至使符号发生改变。
③利用逐步筛选方法筛选解释变量可在一定程度上避免多重共线性问题。
②解释变量间的交互作用
①定义
若一个解释变量的效应依赖于另一个解释变量的水平,
即一个解释变量与反应变量的关系,随着另一个解释变量取值的改变而改变,
则称这两个解释变量间存在交互作用
②检验是否存在交互作用最直接的方法
在回归模型中引入可能存在交互作用的两个解释变量的乘积项,
有时称为linear-by-linear交互作用项, 然后检验该乘积项是否有统计学意义。
应注意,引入变量间交互作用时,各变量的主效应必须纳入模型中
③通径分析
适用于当解释变量个数较多时,相互间的关系变得十分复杂,
而且有些解释变量并不是直接影响反应变量,
而是通过对其他解释变量的作用间接影响反应变量。
第二节logistic 回归️反应变量为分类变量
1、模型
(1)概念及基本形式
①定义
是研究二分类或多分类反应变量与某些影响因素之间关系的一种多重回归分析方法
常用于当反应变量是分类变量,且解释变量与反应变量不呈线性关系时
②基本形式
(2)在流行病学意义
①概念
将logit(π)视为一个整体,回归系数βi为其他解释变量保持不变时,
解释变量xi每改变1个单位,logit(π)的平均改变量。
其解释可与流行病学中的优势比(OR)联系起来
②公式
解释变量xi仅有两个取值0(非暴露)和1(暴露)
OR=exp(β₁)或者β₁=In(OR)。
③解释
①其他解释变量不变时,暴露于某影响因素xi,相对于非暴露于该影响因素的OR值的自然对数;
②或者调整(控制)其他解释变量的影响后,解释变量xi每增加一个单位,得到的优势比的自然对数。
③当β=0时,OR=1,暴露与结局间不存在关联;当β≠0时,OR≠1,暴露与结局间存在关联。
③当解释变量xi的回归系数βi>0时,ORi>1,提示xi为危险因素(增加结局发生的风险)。βi<0时,优势比ORi<1,提示xi为保护因素(降低结局发生的风险)
2、参数估计及假设检验
(一)参数估计
(1)基本思想
通常采用极大似然估计(MLE)
基本思想是求解出得到样本结局的可能性最大的b0,b1,b2…bp值。
(2)公式
L表示似然函数,
Ⅱ表示连乘,
π表示阳性结果发生的概率。
对似然函数取对数后,
用Newton-Raphson迭代方法得出参数β0,β₁,β₂,…,β,的估计值及其标准误。
(二)OR值的估计与解释
当样本含量n较大时,βi的抽样分布近似服从正态分布,
优势比ORi的100(1-a)%置信区间为
(三)假设检验
1、logistic回归模型的假设检验
①目的
检验所有解释变量的线性组合是否与logit(π)
或所研究事件的对数优势比存在线性关系
②检验的方法有
似然比检验
计分检验(矩阵运算)
Wald检验(不仅可对模型整体进行检验,还可以对每一个解释变量的回归系数进行检验)
③检验假设为
H₀:β₁=β₂=…=βp=0,即所有解释变量的偏回归系数均为0。
④似然比检验统计量G为
2、 logistic回归系数的假设检验
①目的
判断每一个解释变量是否对模型有贡献。
②回归系数的检验假设为
H0:βi=0,即某一个解释变量的总体回归系数为0
③常用的假设检验方法为Wald检验
④检验统计量WaldX²服从自由度为1的X²分布
⑤计算公式为
3、用途及注意事项
(1)用途
(1)影响因素分析
通过回归系数与优势比,logistic回归模型可以对影响事件结局的因素进行多因素分析,从多个影响因素中筛选出危险或保护因素。
(2)预测
当给出解释变量数值后,可通过建立的logistic回归模型计算某事件发生的概率,对结局作出概率性的预测和判断。
(2)应用注意事项
1、logislic回归分析的应用条件
①前提条件
要求研究对象间彼此独立,即个体间具有独立性。
当研究个体间存在聚集性特征时,可考虑采用广义估计方程或多水平模型等更复杂的 方法进行分析。
②logistic回归模型的反应变量可为二分类、无序多分类或有序分类变量;当反应变量为多分类时,可釆用多分类logistic回归分析。
③解释变量可以是任意类 型,如定量变量、二分类变量、无序多分类变量或有序分类变量等。
2、模型的拟合效果评价
①logistic回归模型的假设检验只回答模型及回归系数是否具有统计学 意义,不能说明模型的拟合效果。
②评价建立的logistic回归模型的拟合效果,即评价模型预测值与观 测值的一致性,需要进行拟合优度检验。
③常用评价模型拟合优度的指标主要有PearsonX²、偏差统计量等。对于含有连续型解释变量的logistic回归模型,应进行H-L拟合优度检验。
第三节Cox回归️反应变量为风险函数
1、模型
(1) 基本概念
(1)定义
以生存结局和生存时间为因变量,可同时分析多个因素对生存期的影响,
可分析有删失生存时间的资料,且不要求资料服从特定的分布类型。
在基准风险率函数未知的情况下估计型参数的方法,
该估计方法被称为Cox比例风险回归模型,简称 Cox 回归
Cox回归可用于影响因素分析、校正协变量后的组间比较以及生存预测等。
(2)Cox回归模型是半参数模型
常将风险率函数表达为基准风险率函数与相应协变量函数的乘积,即
①h(t,x)
表示t时刻的风险率函数;
②h₀(t)
表示t时刻的基准风险率函数,
即t时刻所有的协变量取值为0时的风险率函数;
③f(x)为协变量函数
(2) 基本形式
①h(t,x)
表示具有协变量x的个体在时刻t的风险率,
又称为瞬时死亡率,是参数部分
②h₀(t)
为基准风险率,
即协变量x₁,x₂,…,xp均为0时的风险率;
③β1,β₂…,βp
①含义
为解释变量的偏回归系数
②统计学意义
表示在其他变量不变的条件下,
变量xp每变化一个单位时,
所引起的风险比的自然对数的变化,或使风险函数增至exp(β)倍。
(3) Cox回归模型的假设条件
①比例风险假定
①各危险因素的作用不随时间变化而变化,即h(t,x)/h0(t)不随时间变化而变化。
②Cox回归模型要求风险函数与基准风险函数呈比例。如果这一假定不成立,则不能用Cox回归模型进行分析。
②对数线性假定
模型中的协变量应与对数风险比呈线性关系。
(4) Cox回归模型结果及解释
①风险比RR
Cox回归模型的风险函数中,lnRR=lnh(t,x)/h0(t)为风险比的自然对数。
β1x1,β2x2..βpxp为解释变量的变化量与相应回归系数的线性组合,
其中βj(j=1,2,…,p)的实际意义是
在其他解释变量不变条件下,变量xj每增加一个单位所引起的风险比的自然对数,
当βj>0时,RRj>1,xj说明xj增加时,风险函数增加,即xj为危险因素;
当βj<0时,RRj<1, 说明xj增加时,风险函数下降,即xj为保护因素;
当βj=0时,RRj=1,说明xj增加时,风险函数不变,即xj为 无关因素。
②预后指数(PI)
Cox回归模型的风险函数中β1x1+β2x2++βpxp为解变量的变化量与相应回归系数的线性组合,变量的线性组合取值越大,则风险函数h((t,x)越大,预越差。线性组合的取值称为预后指数。
③生存率的估计
具有解释变量为,x1,x2…xp的个体在t时刻的生存率可由下式估计:
④变量筛选
主要有向前引入法、 向后剔除法和逐步引入—剔除法,
检验水准a可0. 10或0. 15(变量数较少或探索性研究)、0.05或 0.01 (变量数较多或证实性研究)等。
2、参数估计及假设检验
(1)Cox回归的参数估计
Cox回归模型中,回归系数β1,β2..βp的估计需借助偏似然理论,用极大似然估计方法得到。
该估计的最大优点是不需确定基准风险函数h0(t)的形式就能估计回归系数;
另一特性是估计结果仅与生存时间的排序有关,而不是生存时间的数值大小
(2)Cox回归的假设检验
回归系数β1,β2..βp的假设检验方法类似于logistic回归,有似然比检验、Wald检验和score检验,检验统计量均服从X²值分布,自由度为模型中待检验的参数个数,上述三种假设检验方法均可用于对总模型的检验。
3、用途和注意事项
(一)Cox回归模型的用途
1、影响因素分析
既可以筛选有统计学意义的变量,也可以分析变量间的交互作用。
2、预测
RR及RR的95%置信区间是这些关系效应大小的估计。当给出解释变量数值后,可通过建立的Cox 回归模型计算生存曲线,预测个体疾病发生风险。
(二)Cox回归模型应用的注意事项
(1)Cox模型的基本假定是比例风险假定。只有满足该假定前提下,基于此模型的分析预测才是可靠有效的。
(2)样本要具有代表性,样本含量要足够大,生存事件的删失比例不能太大。
(3)无多分类变量应设置哑变量,并作为一个因素整体进出模型。
(4)Cox模型属比例风险模型,须满足或近似满足比例风险假定。
(5)变量筛选是一个复杂的建模过程,应注意模型的可解释性。
4、三种多重回归分析的区别与联系
1、区别
(1)多重性回归
①应变量类型
定量变量
②截尾数据
不能处理
③模型的形式
不对反应变量进行变换
④分析指标
偏回归系数
⑤参数检验
检验t检验或F检验
⑥参数估计
最小二乘法
⑦参数解释
其他变量不变条件下,变量Xj每增加一个单位所引起的Y的平均改变量
⑧预测指标
⑨样本含量
至少5~10倍的自变量个数
⑩举例
收集体重、胸围及肩宽,分析影响女大学生肺活量的因素
(2)Logistic回归
①应变量类型
二分类、无序多分类或有序分类变量
②截尾数据
不能处理
③模型的形式
对反应变量进行logit变换
④分析指标
偏回归系数和OR值
⑤参数检验
似然比检验、Wald检验和Score检验
⑥参数估计
最大似然法
⑦参数解释
其他变量不变条件下,变量Xj每增加一个单位所引起的优势比OR的自然对数改变量
⑧预测指标
⑨样本含量
至少15~20倍的自变量个数
⑩举例
研究食管癌的发生与吸烟、饮酒、不良饮食习惯等危险因素的关系
(3)Cox回归
①应变量类型
带有生存时间的分类变量
②截尾数据
能处理
③模型的形式
在比例危险假定基础上构建的
④分析指标
偏回归系数、RR值或HR值
⑤参数检验
似然比检验、Wald检验和Score检验
⑥参数估计
最大似然法
⑦参数解释
其他变量不变条件下,变量增加一个单位所引起的相对度RR的自然对数改变量
⑧预测指标
⑨样本含量
至少15~20倍的自变量个数
⑩举例
心脏病患者生存情况的影响因素
2、相同点
①都是多因素分析方法,用来探讨一个反应变量与多个解释变量间的关系。
②对解释变量(协变量)的类型都不做严格要求,可以是定量变量,也可以是分类变量
③偏回归系数均是描述反应变量随解释变量变化间关系的重要统计量。
第12章 两指标间的曲线回归
12.1引言
12.2拟合回归曲线的用途
12.3拟合回归曲线的步骤
12.4拟合指数曲线
12.5拟合双曲线
12.6拟合简单抛物线
12.7拟合 logistic 曲线
12.8拟合回归曲线的正确应用
(三)生存分析——变量与时间
第一节基本概念与主要内容️统计描述
1、生存数据
①定义
在医学研究中,研究者有时除了考虑某事件发生与否,
还需考虑发生该结局所经历的时间长短,
此时数据兼有时间和结局两种属性,被称为生存数据
②分类
(1)完全数据
在整个研究过程中,随访到了观察对象的终点事件发生的时间,
研究者可以获得从起点到终点完整的生存时间,这样的数据称为完全数据。
完全数据提供的是准确的生存时间。
(2)删失数据
定义
又称为截尾数据,
在整个研究过程中,无法确切获得生存时间的数据,称为删失数据
产生原因有
①失访
由于患者变更联系方式、 未继续就诊
或拒绝访问等原因,无法继续随访,未能观察到终点事件。
②退出
患者死于其他疾病或因其他原因死亡(如死于车祸)而终止观察。
③终止
研究结束时终点事件尚未发生。
③特点
①生存数据兼有时间和结局两种属性。
②生存时间的数据通过随访收集获得,且有删失,为非正态分布。
③因研究不同,生存时间常呈指数分布、对数正态分布等复杂分布,需要与之对应的统计方法来分析这类特殊的数据。
2、生存分析
(1)定义
将事件的出现与否和到达终点所经历的时间结合起来分析的一类统计分析方法
生存分析可以充分利用删失数据所提供的不完全信息。
(2)生存时间
①定义
指从观察起点到终点事件的时间间隔,
或从起点时间开始到发生终检所经历的时间,常用符号T表示。
往往不满足正态分布。
②生存时间的三要素
①观察起点(起点事件)
①是所有观察对象在同一时间点接受治疗
②是观察对象 在不同时间点接受治疗,较为常见。
②观察终点(终点事件)
又称失效事件或死亡事件,
泛指标志某种处理措施失败或失效的特征事件。
一般是在设计阶段根据研究目的来确定。
研究者所关心的研究对象的特定结局,如死亡、复发等
如肾上腺皮质癌患者手术后的死亡
注意:终检和失效事件的关系,当没有观察到失效事件发生,为终检
③时间间隔的度量
根据研究选择相应的度量单位,如年、月、日,小时等
三者均需根据研究目的,在研究设计阶段明确定义,且在整个研究过程中保持不变
(3)主要内容
①描述生存时间的分布特点
②比较生存曲线
③分析影响生存状况的因素
3、生存曲线
1、定义
以生存时间(ti)为横坐标,各时间点的生存率S(ti)为纵坐标,
将各个时间点的生存率连接在一起绘制成的连续曲线称为生存曲线。
是更为直观的图示法描述生存率随生存时间而变化的曲线
2、相关指标
(1)死亡概率和死亡率
(1)死亡概率
①含义
用q表示,指某时段开始时存活的个体,在该时段内死亡的可能性。
如年死亡概率表示年初尚存人口在今后1年内死亡的可能性。
②公式
(2)死亡率
①含义
在单位事件里死亡的平均水平
②计算方法
(2)生存概率和生存率
(1)生存概率
①含义
用p表示,指某时段开始时存活的个体,到该时段结束时仍存活的可能性。
如年生存概率表示年初尚存人口存活满一年的可能性。显然p=1-q。
②公式
③与生存率的关系
①区别
生存概率
是单位时间上生存的可能性
生存率
是某个时间段(由一个或多个单位时间组成的时间段)生存的可能性,
即数个单位时间生存概率的累积结果。
②图形展示
如评价肿瘤治疗后3年生存率,
指第1年存活,第2年也存活,直至第3年仍存活的累积概率,
而这3年间每1年有不同的生存概率。
(2)生存率
①含义
又称为生存函数或累积生存率,
表示观察对象的生存时间T大于时间t的概率,
常用S(t)表示,即S(t)=Pr(T>t)
②计算公式
①若无删失数据,直接法
②若有删失数据,须分段计算生存概率
利用生存概率计算生存率。
如寿命表(已分组数据)、K-M法(未分组数据)
③特点
生存函数是一个随时间下降的函数
t=0时,生存函数值为1,表示每个患者在接受治疗前处于存活状态;
当t趋于无穷大时,生存函数值趋于0,表示每位患者的生存时间是有限的。
(3)中位数生存时间
①定义
生存函数取值为0.5时,对应的生存时间称为中位生存时间,
又称中位生存期或半数生存期,记为T50,即S(T50)=0.5。
它表示有50%的个体可以存活到比T50更长时间,通常用于描述生存期的平均水平
②注意
中位生存时间通常不等于生存时间的中位数
③举例
例如,肾上腺皮质癌患者接受治疗后,
若S(t=20)=0.5,表示有50%的患者经该治疗后可以存活到20个月以上。
第二节生存曲线的估计(非参数法)️→统计描述
—、Kaplan-Meier 法
1、基本思想
又称乘积极限法(PL法),简记为K-M法,是一种非参数的估计生存率的方法。
是将所有观察对象的生存时间(包括删失数据)由小到大依次排列,
对每个时间点 进行死亡概率、生存概率和生存率的估计。
一般用于观察对象数目较少的未分组资料,
它能够充分利用每条记录的信息,估计不同生存时间点的生存率。
2、生存率及其标准误的计算
①编号和排序
将生存时间t,从小到大排序并编号i,i=l,2,3,…,k。
相同的生存时间只取其中一个参加排序;
完全数据与删失数据相同时,分别列出,完全数据列在删失数据前面。
②各t时刻的死亡人数di和t时刻后截尾人数ci
③计算期初人数(ni)
每一时间点ti之前观察到的生存例数,
即为期初例数几ni
④计算各时间点的死亡概率q^i和生存概率p^i
注意:所有删失时间点上的q为0,p为1。
⑤计算各时间点生存率S^(ti)
注意删失数据所对应的死亡例数为0,其生存概率为1,
删失数据对应时间点的生存率与前一个完全数据时间点的生存率相同。
⑥计算生存率的标准误SE[S^(ti)]
3、中位生存时间和生存曲线
(1)中位生存时间
①如果样本生存率中有S^(ti)=0.5,中位生存时间T50=ti;
②如果样本生存率中没有0.5,则可采用插值法进行估计。
③举例
如中位生存时间在10-13月之间,
S^(t=10)=0. 5714,S^(t=13)= 0.3810,则有
(2)生存曲线
①定义
未分组资料的生存曲线称K-M曲线
②前提
有确切的失效事件发生时间
→两个失效事件所构成的生存率无变化
→生存曲线呈阶梯式
③图形
它以水平横线的长短代表一个时点ti到下一个时点ti+1的距离,
相邻两个时间点之间生存率不变 ,但在右端点处死亡概率即刻改变,生存率降低。
随着生存时间的增加,曲线呈下降趋势。
如果曲线阶梯陡峭,表现为下降速度快,往往生存期较短。
随着时间点的增多,曲线阶梯形不明显。
4、生存率的95%置信区间
二、寿命表法
1、基本思想
(1)基本思想
寿命表法可看作为K-M法的一种近似(频数表法),
适用于样本例数较多时的生存资料
对于样本含量较大的随访资料,
一般情况下,我们将原始资料按生存时间分组后再进行分析,
(2)分类
①现时寿命表
是基于特定人群的(横断面调查资料)中不同年龄组的尚存人数
和死亡人数估计死亡率、生存率和期望寿命等
②定群寿命表
是基于生存时间分组的(随访频数分布资料)进行生存率估计
2、生存率及其标准误的计算
①确定分组区间[ti,ti+1]
一般每个区间为等宽的半闭半开区间,
最后一个区间终点在无穷大处
②计算期内死亡数di、期内删失数ci和期初观察人数ni
第一个时间区间ti的期初观察人数ni是所有的观察例数。
每一时间点ti之前观察到的生存例数,即为初期例数ni
计算方法:ni+1=ni-di-ci
③计算期初校正人数nc
因在ti区间内的删失个体并未观察至区间的终点,
区间内的有效 人数不是ni,
我们假定ci个删失个体在该区间内均匀分布,
平均每个删失个体观察到半个区间时间,
那么校正人数nci为:nci=ni-ci/2
④死亡概率q^i和生存概率p^i计算
q^i=di/nci,p^i=1-q^i
各时间区间对应的生存率应是该区间上限时间点的生存率
如[16,18)生存时间区间的生存率是0.5141,指的是煤工尘肺患者确诊后预测其活过18年的生存率是51.41%,而不是活过16年的生存率。
⑤计算生存率S^(ti)
概率乘法原理
S^(ti)=Pr(T>tk)=S(tk-1)pti=p1p2……pti
⑥计算生存率标准误SE[S^(ti)]
3、中位生存时间和生存曲线
1、中位生存时间
计算与K-M法 一致,
只是如果样本生存率中有S^(ti)=0.5,则半数生存期T50 等于其区间的上限时间;
如果样本生存率中没有0.5,仍采用插值法进行估计。
2、生存曲线
①特征
寿命表法估计生存率可以绘制成连续的折线形生存曲线,该曲线为右连续,
即寿命表法估计的是时间区间右端点的生存率。
由于寿命表法一般用于大样本资料,
通常在最后个时间区间仍会有较多的观察例数,故曲线尾部稳定性较 K - M 法好。
②图形
没有确切的死亡时间与失访时间
→每个时间段中的生存率呈线性变化
→生存曲线呈折线下降
4、与K一M法的比较
寿命表法
①适用资料
大样本或无法准确得知研究结果出现时间的资料
②分段及生存率
指定的时段来分段,
估计的是时间区间右端点上的生存率
③生存曲线特点
生存率呈线性变化,
各个组段间的生存率用直线相连接
K一M法
①适用资料
用于小样本,也可以用于大样本
但要求每个观察对象都有确切的死亡时间和截尾时间
②分段及生存率
死亡时点分段,
逐个估计死亡时点的生存率
③生存曲线特点
生存曲线是右连续的阶段形曲线。
当样本量较大及死亡时点较多时,阶梯型就不明显了
第三节生存曲线的比较️→统计推断
1、概述
(1)性质
①是比较多组生存曲线的一种常用的非参数检验方法
②对资料的分布基本没有要求,但要求每组均含有失效事件发生的观察对象资料
③其检验的检验效能仅与发生失效事件的人数有关
④在对数秩检验时,一般要求各生存曲线不能交叉,否则需采用分段或多因素方法分析
(2)基本思想
假定拟进行比较的不同总体生存函数无差别,
根据不同生存时间的期初观察人数和理论死亡概率。
计算两个(或多个)比较组的理论死亡数,并与实际观察到的死亡数进行比较。
衡量观察数与理论数差别大小的统计量为X²值,
服从自由度为(组数-2)的X²分布,
其检验统计量的计算为
(3)其他统计推断检验的方法
①生存曲线是否相同→Log-rank检验
比较的是两组总体生存情况之间的差异是否有统计学意义
②生存状况优劣对比
①生存曲线目测判断
由图12-5可知,辅助化疗组的生存曲线高于单纯手术组,故辅助化疗组的生存情况较单纯手术组好。
②半数生存期比较
本例中辅助化疗组T50= 11.124(月),单纯手术组T50 = 5. 500(月),说明辅助化疗组的半数生存期较单纯手术组长。
③相对危险度RR比较
相对危险度是因素效应指标,可以反映某因素作用的相对大小
④正态近似法
如关注某个时间点的两组样本的生存率是否相同,
2、假设对数秩检验
1、建立检验假设,确定检验水准
H0:两变量的生存曲线相同。
H1:两变量的生存曲线不同 。
a= 0. 05
2、计算检验统计量
(1) 按生存时间将各组资料统一排序
①将两组变量按生存时间统一从小到大排序,相同时点只排一次;
②如果完全数据和删失数据的时点相同,则分别排列,
(2) 各时间点各组的期初病例数、死亡数和删失数
①期初总病例数为ni=n1i+n2i
②总的死亡数为d1i=d1i+d2i
③不同时点的期初病例数=其前一时点的期初病例数—去相应的死亡数和删失数
(3) 分别计算两组变量各时点的理论死亡数
T1i=n1ixd1i/ni
T2i=n2ixd2i/ni
(4) 计算X²统计量
若两组各时间点的生存率相等,两组总的理论死亡数T和观察死亡数A应相差不大
3、确定P值,作出推断
査X²界值表,比较统计量X²值
P<0. 05,两组生存曲线的差异有统计学意义。
四、研究设计
第13章 研究设计——总论
1、基本概念→按是否能够认为设置处理因素
观察性研究®调查研究设计
概念
又称非实验性研究/对比研究/非随机化对比研究,
以客观、真实的观察为依据,对观察结果进行描述和对比分析
特点
①(不能认为)施加干预措施
②受试对象接受任何处理因素或同一处理因素不同水平(不由随机化决定)
实验性研究®实验设计
概念
研究者能够评价(人为干预)效果的研究
特点
优点
①受试对象干预前来自(同一群体),能较好控制(非处理因素)的影响
②(随机分组较好控制(选择偏倚),使组件具有可比性)
缺点
①当样本量小时,不能保证非处理因素在组间有较好的可比性和均衡性
②伦理学问题
2、实验设计的基本要素
(1)受试对象
①概念
是接受处理因素作用的基本单位,亦称研究对象。
②分类
动物实验(动物或生物材料)、
临床试验(患者)
和现场试验(正常人)
③要求
Ⅰ、同质性和代表性;
Ⅱ、两个基本条件:对处理因素敏感、反应稳定;
Ⅲ、明确的纳入标准和排除标准;
(2)处理因素
①概念
根据研究目的施加于研究对象的某类处理措施,
并在实验中需要观察阐明处理措施的效应。
②分类
单因素单水平
单因素多水平
多因素单水平
多因素多水平
③非处理因素
Ⅰ、与处理因素相对应并同时存在;
Ⅱ、能使受试对象产生效应因素;
Ⅲ、又称混杂因素;
④注意事项
a、分清处理因素和混杂因素;
b、保持处理因素衡定不变
(3)实验效应
①概念
处理因素施加给实验对象后产生的效应或反应称为实验效应,可用观察指标来度量
②观察指标特点
Ⅰ、客观性(主观/客观指标);
Ⅱ、精确性(准确度、精密度);
Ⅲ、特异度(反映鉴别真阴性的能力)和灵敏度(反映检出真阳性的能力);
③指标的观察
盲法(单盲:盲受试者;双盲:同时盲受试者和研究者;)
3、实验设计的基本原则
对照原则
含义
对照及均衡性
意义
对非试验因素的条件加以控制、尽量排除“非处理因素”的影响
要求
①对照
对等、同步、专设
②均衡性
组间差异越大越好,
组内差异越小越好
种类/形式
①安慰剂对照
安慰剂对照适用于临床试验。
安慰剂
或称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其外观如剂型、大小、颜色、重量、气味及口味等都与试验药物一样,不能为患者所识别。
安慰剂的使用需慎重,适用于研究的疾病尚无有效治疗药物,或使用安慰剂后对该病病情、临床过程、预后无影响或不利影响小的情况,一般与盲法结合使用。对于急、重或器质性疾病的研究不宜使用安慰剂对照。
②空白对照
对照组不接受任何处理,常用于动物实验,
在临床试验中主要用于安慰剂及盲法、无法执行或执行困难的情况。
③实验对照
对照组不接受处理因素,但接受某种与处理因素有关的实验因素。
如在小学生课间添加高钙牛奶对生长发育的影响研究中,试验组小学生课间饮用高钙牛奶,对照组为普通牛奶。这里课间饮用牛奶是与处理因素有关的试验因素,两组除是否在牛奶中加钙外,其他条件一致,这样才能分析钙对生长发育的作用
④自身对照
对照与试验在同一对象身上进行,
如身体对称部位或试验不同阶段分别接受不同的试验因素,一个为对照,一个为试验,比较其差异。
自身对照简单易行,使用广泛。例如服药前后体重的对照。
⑤标准对照
用现有公认的标准方法或常规方法作为对照。
临床试验不给患者任何治疗不符合伦理要求,这时采用当前确认疗效的常规药物作为对照是最好的选择。
例如:在实验研究中常用于某种新方法是否能代替传统方法的研究。
⑥相互对照
各实验组(如同一药物的不同剂量组)互为对照,不专门设立对照组。
例如,研究饲料中蛋白质含量对幼鼠体重增加的影响,依据饲料中蛋白质含量设立低(1%)、中(5%)、高(10%)3个剂量组,互为对照。
随机原则
含义
总体中的每一个研究对象(观察单位)都有同等的机会被抽到研究的样本中去
或以概率均等的原则被分配到各处理组和对照组的一种措施。
意义
不仅能控制已知的非处理因素,而且还能控制未知的非处理因素
形式
①抽样随机
总体中每个个体都有(相同机会被抽到样本中)
②分组随机
每个受试对象(被分配到各组的机会相等)
③实验顺序随机
每个受试对象(先后接受处理的机会相等)
重复原则
含义
在相同实验条件下多次独立重复实验次数
意义
避免偶然现象
形式
①整个实验的重复
②用多个受试对象进行重复
③同一受试对象的重复观察
4、实验设计的样本四要素
(1)比较总体参数间的差值δ
如两总体均数的差值δ=|μ1-μ2|,
或两总体率的差值δ=|π1-π2|。
δ愈大,所需样本含量愈小。
(2)有关总体变异的信息
如比较均数时需了解总体标准差σ,
σ反映资料的变异性,σ愈大,需样本含量自然愈多。
比较频率时需了解总体概率π1和π2,它们决定了资料的变异性;
π1和π2愈近50%,变异性愈大,所需样本含量愈多。
若研究者无法获得σ或π1和π2的信息,可通过查阅文献可预实验来估计。
(3)第I类错误的概率α
α即假设检验中的检验水准,其大小α据研究目的而定,
α愈小,所需要样本量愈多。
对于相同的α,双侧检验比单侧检验所需样本含量多,
α通常取α=0.05。
(4)第II类错误概率的大小β或检验功效(1-β)
第I类错误概率愈小,检验功效愈大,所需要样本含量愈多,
一般要求检验效能≥0.80。β通常取0.20,0.10或0.05
5、实验研究误差的来源及其相应的质量控制措施
1、误差来源
1、非随机误差
(1)定义
非随机误差也称为系统误差或偏倚。
是由各社会人为因素或偶然因素造成的,又称过失误差
涉及研究者和实验对象,并贯穿于实验设计、数据收集、整理和分饥的全过程
(2)非随误差的来源
主要有选择偏倚、测量偏倚和混杂偏倚。
(3)分类
系统误差
可知的或可控制的原因
属出现倾向性偏差分布
可以控制
过失误差
研究者偶然失误造成
属不规则分布
不可控制,统计分析
2、随机误差
(1)定义
质量控制主要针对非随机误差进行,
是一类不恒定、随机变化的误差。
位置的、无法控制的原因
属正态分布
无法完全控制,统计分析
(2)随机误差来源
(1)随机测量误差
同一条件下对同一对象反复进行测量,
虽极力控制或消除系统误差后,
每次结果仍然会出现一些随机变化(例如测血压)。
(2)抽样误差
抽样过程中由于抽样的偶然性(个体变异)而出现的误差。
表现为样本均数与总体均数,样本均数与样本均数之间不同。
(3)随机误差特点
①随机误差是不可避免的,但是呈现一定规律性变化。
②造成随机误差的影响因素很多很复杂,无法掌握其具体规律。
③随机误差呈正态分布,可用统计方法进行分析。
2、质量控制措施
①设计阶段
①明确定义实验对象
②明确划分观察范围
③避免遗漏研究对象或包含非研究对象
④正确的观察指标
⑤明确定义观察项目
⑥开展预实验,对实验方案进行可行性评估,考察是否合理可行,能否达到预期目的
②数据收集阶段
①盲法
①单盲
只有研究对象不知道分组情况。
②双盲
是研究对象和观察者均不知道分组情况。
②定期督导和检查研究记录。
③采取有效措施减少研究对象的失访,提高依从性。
③数据整理分析阶段
①检查记录的完整性与正确性;
②数据双录入,不同人员独立地进行数据整理,并核对结果是否一致;
③利用计算机程序对数据整理进行核查,针对重要的非研究因素进行分层分析或多因素分析,以调整和控制其对研究结果的影响等。
第14章 研究设计——实验设计
完全随机设计→一步法,一次性随机分组
概念
又称简单随机设计,
采用完全随机化分组方法将同质的实验对象分配到不同的组,
各组分别接受不同的处理。
注意
①个体同质性要好
②总体样本含量一定时,平衡设计时检验效率最高
优缺点
优点
设计简单、易于实施、缺失数据时仍可进行统计分析
缺点
①样本量较小时,均衡性较差,抽样误差较大。
②与随机区组设计相比,有混杂因素情况下效率较低。
随机分组方案
①编号
将实验对象按某一特征依次编号。
②取随机数
从随机数字表或随机数发生器获取随机数,
每个实验对象获得的随机数,
一般与样本量的位数相同。
③排序
将随机数从小到大编序号。
④分组
从排序后的随机数中,规定前 n1 个随机数对应的编号为第1组,
第( n1 +1)个随机数对应的编号至第( n1+n2 )个随机数对应的编号为第1组,以此类推。
配对设计→组对子,自身或异体配对
概念
是指将实验对象按一定条件配成对子,
再将每对中的两个实验对象随机分配到两个不同的处理组。
注意
配对设计的成败取决于对子中两个个体的同质性或相关性
优缺点
优点
配对设计中每个对子的实验对象会有较好的同质性,正确使用配对设计可以减少抽样误差,更易发现处理组间的差别,比完全随机设计得到更高的检验效能。
缺点
配对条件不能过多、过严,否则将难于找到足够可以配对的个体,但过宽松的配对条件又可能造成配对欠佳
随机分组方案
随机区组设计
概念
实际上是配对设计的扩展,
是将几个实验对象按性质相同或相近者组成区组,
再分别将各区组内的实验对象随机分配到几个处理组。
注意
组间差异越大越好,组内差异越小越好
优缺点
优点
每个区组内的受试对象有较好的同质性,
与完全随机设计相比,减少了非研究因素误差,提高了实验效率
缺点
要求区组内的处理因素个数与每个区组的实验对象数量相等,
实验结果中有数据确实统计分析较麻烦
随机分组方案
14.4拉丁方设计
14.5析因设计
14.6交叉设计
第15章 研究设计——临床试验设计
随机对照试验(RCT)
概念
将(具备纳入标准和不具备排除标准)的受试对象随机分配到实验组和对照组,
在一致的条件或环境里,同步地进行研究和观察试验效应,
并用客观的标准试验结果进行科学的衡量和评价的试验设计
注意
内部真实性和外部真实性
优缺点
优点
应用盲法可避免数据收集和评价过程带来的可能偏倚,便于后续的统计分析
缺点
样本量大,研究周期长、耗费人力、物力,在有些情况下可能涉及伦理道德方面
随机分组方案
①制定实验计划
②确定研究对象
③样本含量计算
④严格进行随机化分
⑤盲法的应用
⑥资料的收集与分析
观察性研究设计
横断面研究
病例对照研究
队列研究
第16章研究设计——调查设计
1、调查研究的特点与分类
1、特点
(1)调查目的
①为了了解总体参数,说明总体特征
②研究事物之间的关联
(2)调查对象与观察单位
(3) 调查方法与调查项目
调查方法和调查项目
调查方式(观察法、问卷法、访谈法)
调查表
2、分类
(1)从调查的范围可分为
①全面调查(普查)
亦称全面调查
是指在特定时间范围内,对研究总体中的每一个成员逐个进行调查,
如我国的五次人口普查。
理论上只有普查才能获得总体参数,没有抽样误差,但往往非抽样误差比较大。
目的是全面了解研究总体的在某一特定时点的分布与特征,如年中人口数,时点患病率等。
通过普查,可以发现总体中的全部病例,以便及早发现,及时治疗;
通过普查,可以了解人群健康水平,建立生理标准;
普查的同时,可以普及医学知识,使所有调查对象从中受益。
②抽样调查
是从总体中随机抽取一定数量具有代表性的观察对象组成样本,根据样本提供的信息,采用统计学方法推断总体的特征。
抽样调查比普查涉及的观察对象数少,因而节省人力、物力、财力和时间,并易于获得较为深入细致的资料。
③典型调查
亦称案例调查,
是指有意识地选择若干典型的人或单位进行深入研究的一种非全面调查。
例如通过个别典型病例,研究其病理损害等。
由于典型调查没有遵循随机抽样的原则,所得资料不能用于估计总体参数。
典型调查常作为普查或抽样调查的补充,分别从不同角度说明问题。
(2)从调查涉及的时间可分为
①横断面研究
又称现况调查
是在指定的较短时间内,按照研究设计要求,在一定人群中进行普查或抽样调查,
收集有关的疾病或健康状况的资料,
从而描述疾病或健康状态及其影响因素的分布的一种方法。
②回顾性研究
通过一组某病患者,调查其以往是否暴露于某研究因素,
以确定发病与研究因素间有无关联,通常需设立对照组。
“由果及因”
③前瞻性研究
又称队列研究
是将选定的研究人群按研究对象是否暴露于某危险因素,分为暴露组和非暴露组,
在一定时期内,随访观察两组人群某事件(如发病或死亡)的发生情况,
通过比较评价该因素与事件的发生是否存在因果关系,验证研究假说。
“由因及果”
(3)从抽取样本的方法可分为
①概率抽样
是指用随机的方法抽取样本,总体中的每个个体被抽中的概率是非0的、已知的或可计算的。概率抽样是应用统计推断的前提。
②非概率抽样
是指总体中的每个个体被抽中的概率是未知的、无法了解的或无法指定的。
包括典型抽样、自愿者组成的样本等。非概率抽样得到的样本资料,不能用来对总体特征进行参数估计和假设检验。
(4)按调査性质可分为
定量调查
定性调查
2、 几种基本概率抽样方法
1、简单随机抽样
①含义
又称单纯随机抽样,
按完全随机的方法从研究总体中抽取部分观察单位组成样本。
②计算
①总体均数的估计
含义
从有限总体中随机抽取的样本均数的标准误
小于从无限总体中随机抽取的相同样本含量的样本均数的标准误。
当总体观察单位数非常大,样本数相对较小时,f接近于0
公式
s为样本标准差;
f=n/N称为抽样比
(1-f)称为有限总体校正数(FPC)
②总体率或比例的估计
a、当初步估计π在0.2~0.8时
b、当初步估计π小于0.2或大于0.8时
③样本含量的估计
a、估计总体均数时所需样本含量
无限总体
有限总体
b、估计总体比例或率时所需样本含量
无限总体
有限总体
c、与样本含量的估计的因素有关
①调查的精度
用最大相对误差e反映精度的要求,即容许误差δ
精度要求越高,所需样本量就越大。
容许误差δ
即预计样本统计量与相应总体参数的差值控制在什么范围内,
常取可信区间长度之一半;
②总体中个体的变异程度
一般通过预调查、查阅文献、专家经验等方法来估计
③置信水平
通常用置信水平1-α反映置信水平。
置信水平要求越高,所需样本量越大。
可信度通常取0.95。
③优缺点
①优点
①最基本的抽样方法,是其他抽样方法的基础;
②抽样框不需要其它辅助信息,简单直观,抽样效率高;
③样本量的估计、参数及其误差估计方法均比较成熟
②缺点
①总体较大时,难以对总体中的个体一一进行编号;
②抽样框中即使有现成的辅助信息也视而不见,使得估计效率降低;
③且抽到的样本分散,不易组织调查
2、系统抽样
①含义
又称等距抽样或机械抽样
先确定总体的范围和样本含量n,
将总体的N个观察单位按照某一顺序编号,
并按序等分成n份,每一份k个观察单位,
再从第一部分中随机抽取一个观察单位,
如第r号观察单位(1≤r≤k),
然后依次等间隔地从每一份中均抽取第r号观察单位组成样本
即抽到的样本号分别是r,k+r,2k+r,3k+r,…,(n-1)k+r。
②计算
按简单随机抽样的方法来估计样本量。
③优缺点
①优点
①易于理解,简便易行;常用于多阶段抽样的后阶段抽样。
简便易行。有时甚至不需要严格的抽样框的信息,只要确定了抽样的起点和抽样间隔,样本就自然确定了。
②容易得到一个在总体中分布均匀的样本,可提高抽样效率。
②缺点
①当总体的观察个体按顺序有周期性或单调增减趋势时,可能产生偏倚,代表性差
②抽到的样本较分散,不易组织调查。抽样误差可按简单随机抽样方法估计。
3、整群抽样
①含义
是以“群”为基本单位的抽样方法。
先将总体划分为K个群,每个群包括若干观察单位;
再从总体中按照某种方式随机抽取k个群,
并将被抽到的各个群的全部观察单位组成样本。
各群内的观察单位,可以相等,也可以不等。
②计算
①总体均数的估计
样本群数为G
②总体率或比例的估计
无限总体
有限总体
③样本含量的估计
a、估计总体均数时所需样本含量
b、估计总体比例或率时所需样本含量
③优缺点
①优点
整群抽样的最大优点是便于组织调查,节约成本,容易控制调查质量。
②缺点
缺点是样本量一定时,抽样误差一般大于简单随机抽样。
4、分层抽样
①含义
先将总体中全部个体按某种特征分成若干“层”,
再从每一层内随机抽取一定数量的个体组成样本。
抽样的方式
等比例分配
大层多抽,小层少抽,各层中抽取的比例与该层在总体中所占的比例相同,即n/n=N;/N。其中,n,为从各层中抽出的样本数,n为总的样本量,N为各层具有的个体数,N为总的个体数。这样抽取的样本是总体的缩影,各层的结构与总体相同。
非等比例分配抽样
如分层后,各层抽取数量相同的个体组成样本。
最优分配分层随机抽样
如果抽样时除了考虑各层在总体中的比例,还考虑其变异情况,变异大的层多抽,变异小的层少抽,这样抽样可以减小抽样误差,所以又称
先按影响观察值变异较大的某种因素或特征,
将总体分为若干层,每层内观察值性质相近,变异较小,而各层之间差异较大;
再从每一层内随机抽取一定数量的观察单位,合起来组成样本。
②计算
①总体均数的估计
②总体率或比例的估计
③样本含量的估计
a、估计总体均数时所需样本含量
b、估计总体比例或率时所需样本含量
③优缺点
①优点
①样本具有较好的代表性,抽样误差较小;
②各层可根据调查对象的特征,采取不同的抽样方法以及资料收集方式;
③统计分析内容更丰富,可以对不同层进行独立分析,还可以比较不同层间的差异
②缺点
①对抽样框的要求比较高,且所有观察单位必须具备分层的辅助信息,收集或编制抽样框的费用和时间也因此增加;
②若调查的变量与分层的变量并不相关,则效率可能降低;
③参数及其误差估计比较复杂;
④当主要观察指标不止一项时,最优分配很难兼顾所有指标。
5、多阶段抽样
①含义
将整个抽样过程分成若干个阶段进行,
在初级抽样单位中抽取二级抽样单位,
又在二级抽样单位中抽取三级抽样单位等。
②计算
①总体均数的估计
②总体率或比例的估计
③样本含量的估计
a、估计总体均数时所需样本含量
b、估计总体比例或率时所需样本含量
③优缺点
①优点
②缺点
6、四种基本概率抽样方法的对比
(1)简单随机抽样
①含义
又称单纯随机抽样,
指从总体 N 个单位中任意抽取 n 个单位作为样本,
使每个样本被抽中的概率相等的一种抽样方式。
②优缺点
①优点
简单直观,其他抽样基础,
计算简便
②缺点
大样本不使用,
变异大时代表性差,
样本分散,难以组织调查
③适用范围
其他抽样方法的基础,
适用于有限总体,多用于总体不太大时
(2)系统抽样
①含义
又称机械抽样,
是按照某种顺序给总体中的个体编号,
然后随机地抽取一个号码作为第一调查个体,
其他的调查个体则按照某种确定的规则“系统”地抽联。
②优缺点
①优点
简便易行,易得到,
按照比例分配的样本,样本在总体中的分布较均匀
②缺点
周期性影响较大
③适用范围
按抽样顺序个体随机分布情况
(3)整群抽样
①含义
是以“群”为基本单位的抽样方法。
先将总体分成若干个群,从中随机抽取一些群,
被抽中群内的全部个体组成调查的样本。
②优缺点
①优点
便于组织,节约经费,
容易控制调查质量
②缺点
抽样误差较大
③适用范围
主要用于群间差异较小的情形
(4)分层抽样
①含义
先将总体中全部个体按某种特征分成若干“层”,
再从每一层内随机抽取一定数量的个体组成样本。
②优缺点
①优点
减少抽样误差,
可对不同层采用不同抽样方法,
可对不同层进行独立分析
②缺点
若层间变量选择不当,层内变异较大,
层间变异较小,分层抽样就失去了意义
③适用范围
主要用于层间差异较大的情形形
(5)多阶段抽样
①含义
通过多次抽取不同的次级抽样单位,
最后在抽中的次级抽样单位中再抽取若干观察单位组成样本。
②优缺点
①优点
充分利用各种抽样方法的优势,
克服各自的不足,并能节省人力、物力
②缺点
在抽样之前要掌握各级调查单位的人口资料及特点
③适用范围
大型流行病学调查
抽样误差大小→整群抽样>简单随机抽样>系统抽样>分层抽样
3、常见的非概率抽样方法
(1)偶遇抽样
又称便利抽样,
是指研究者根据现实情况而采用最便利的方式来选取样本,
可以抽取偶然遇到的人,或选择那些距离最近的、取谷易找到的人作为调査对象。
(2)目的抽样
又称判断抽样,
是研究者根据研究目标和对情况的主观判断来选择和确定调查对象的方法,
是“有且的”地去选择对总体具有代表性的样本。
(3)滚雪球抽样
又称链式抽样或网络抽样。
当无法了解总体情况时,可以从能找到的少数个体入手,对他们进行调查,
并请他们江绍其他符合条件的人,扩大调查面,
如此重复下去直到达到所需的样本量
(4)定额抽样
又称配额抽样,
是按照总体的基种特征(如年龄、性别、社阶层等)进行分层(组)
然后在每一层(组)中按照事先规定的比例或数量(即定额)用便利抽样或目的抽样的方法选取样本。
(5)空间抽样
是对具有空间关联性的各种调查对象及资源进行抽样的一种方法。
这种抽样方法在生态、海洋、渔业、林业、农业、人口健康、环境、土壤及水资源等方面得到了广泛应用。
五、两个专题
第17章寿命表分析
17.1 寿命表的概念
17.2现时寿命表中的主要指标及其意义
17.3现时简略寿命表
17.4现时寿命表的扩展
17.5寿命表的正确应用
第 18章 综合分析
17.1综合分析之思路
18.2多组比较与变化趋势
18.3差值与回归
18.4循序分析
18.5综合分析的正确应用
(83)