导图社区 生物统计学 第四章 统计推断
统计学,统计推断 假设检验,参数估计,统计推断,参数估计与假设检验的基本原理。统计推断的方法知识点总结,帮助小伙伴快速掌握生物统计学的知识要点内容~
编辑于2022-06-04 20:51:56第四章-统计推断
参数估计与假设检验的基本原理
假设检验基本原理
假设检验的基本原理
定义
利用样本统计数推断总体参数的统计方法
假设检验的基本思想
根据抽样结果,在一定可靠程度上,对一个或多个有关总体分布的零假设做出拒绝或接受的推论的统计分析过程。
两种误差
偶然误差(由随机抽样影响
系统误差(由实验条件影响)
假设检验的基本目的就是要判断测得的样本统计量与总体参数之间的差异是系统误差还是偶然误差
两种假设
零假设
备择假设
假设检验的两种方法
单尾检验
灵敏度高
双尾检验
差异显著性检验的原理
检验某个样本统计量的数值与总体参数之间的差异是否显著
假设检验的两类错误
I型错误
弃真错误
又叫α错误
前提条件
Ho为真命题
犯错概率
α%
II型错误
纳伪错误
又叫β错误
前提条件
Ho为假命题
犯错概率
β%
二者关系
不能同时发生
样本量确定时,α↑,β↓
α确定时,通过增加样本量,可以减少β
发生1或2的原因
抽样及抽样误差
人为确定α的大小
小概率理论:一次事件中,人为认定不可能发生小概率事件
两类错误的关系
当样本容量增大时,弃真错误和纳伪错误的概率都下降
当样本容量增大时,样本平均数的抽样分布就越瘦长,Ho与H1两分布的交汇区域就越小
接受域越大,犯弃真错误的概率下降,犯纳伪错误的概率则上升
步骤
提出假设零假设和备择假设
将所作出的声明作为零假设
把要证明的假设作为备择假设
确定检验统计量
大样本应用正态分布检验
小样本一般用t分布检验
确定显著性水平
一般认为概率小于0.05或0.01的事件为小概率事件
确定决策规则
由显著性水平和相应的临界值确定的一个区域称为拒绝域,拒绝域的大小与显著性水平有关
P>a,接受H0,否定HA.反之
当样本量固定时,拒绝域随a的减小而减小
P值是观测到的显著性水平或拒绝原假设的最小显著水平/P值越小,拒绝零假设的理由越充分
检验决策准则
双侧检验
统计量的值>临界值,拒绝零假设
需要记忆的值
α=0.05,双侧1.96,单侧1.65
α=0.01,双侧2.58,单侧2.33
左侧检验
统计量的值<-临界值,拒绝零假设
右侧检验
统计量的值>临界值,拒绝零假设
总 结
假设检验依据的是小概率原理,小概率的标准在抽样前依照需要来确定
假设检验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立
统计假设检验的结果不是绝对正确
参数估计的基本原理
点估计
原理
用样本统计量的单一数值估计未知的总体参数
好的估计量的标准
集中性
良好估计量的方差应该相对集中,也就是方差越小越好
毕竟样本估计量分布越集中,样本估计量与总体参数的差异就越小
无偏性
估计量应该以被估计的总体参数为中心上下波动
即样本容量固定时,抽取的样本个数趋于无穷时,样本统计量抽样分布的平均数应该与总体的平均数相等
一致性
随着样本容量的增加,良好的估计量应该与被估计的总体参数越来越接近
当样本容量趋近无穷时,一个估计量能够等于总体参数
区间估计
原理
依据样本统计量,根据一定的精确度要求,推断总体参数所在的区间和范围
置信水平
判断正确的概率
方法
统计推断
假设检验/显著性检验
一个样本平均数的假设检验
判断一个样本平均数x所属总体平均数μ与已知总体平均数μ0是否存在真实差异的检验。
总体方差σ2已知,无论n是否大于30都可采用u检验法
总体方差σ2未知,但n≥30时,可用样本方差s2来代替总体方差σ2 ,仍用u检验法
总体方差σ2未知,且n<30时,可用样本方差s2来代替总体方差σ2 ,采用df=n-1的t检验法
两个样本平均数的假设检验
检验两个样本平均数x1和x2所属的总体平均数μ1和μ2是否来自同一总体
检验统计量
(1)样本平均数差数的平均数 = 总体平均数的差数
(2)样本平均数差数的方差 = 两样本平均数方差之和
成组数据平均数的比较
适用条件:小样本正态资料,方差齐
两个抽样样本彼此独立,根据两样本所属的总体方差是否已知和样本大小不同而采用不同的检验方法
成对数据平均数的比较
将性质相同的两个样本(供试单位)配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致,以检验处理的效果,所得的观测值称为成对数据
受试对象按一定条件配成对子,再分别给予每对中的两个受试对象不同处理,减少偏好等因素的影响
样本频率的假设检验
一个样本频率的假设检验
适用范围:检验一个样本频率(记为 )的总体频率p和某一理论值或期望值p0的差异显著性
频率的假设检验
样本频率的标准误
当 np 和 nq > 30,不需连续性矫正,则u值为
当 5<np 或 nq<30时,需要进行连续性矫正,u值为
两个样本频率的假设检验
两个样本频率差数的标准误
当 np 和 nq > 30,不需连续性矫正,用u检验
当 5 < np 或 nq < 30,需进行连续性矫正,如果n > 30 ,用u检验
当 5 < np 或 nq < 30,需进行连续性矫正,如果n < 30 ,用t检验
两个方面
参数估计
由中心极限定理和大数定律,只要抽样为大样本,不论其总体是否为正态分布,其样本平均数都近似服从正态分布N(μ,σ2/n)
总体均数的估计
原理:参数估计的重要内容,从样本均数出发,估计总体均数
点值估计
直接把样本均数作为总体均数估计值
不考虑抽样误差影响
区间估计
总体均数的可信区间
算法
u分布
大样本资料(n>100)
理论标准差已知
t分布
小样本,理论标准差未知
其中的v是自由度,v=n-1
利用样本均数,按一定的可信程度(置信度)估计
一个总体平均数μ的区间估计和点估计
当为大样本时,不论总体方差σ2为已知或未知,可以利用样本平均数x和总体方差σ2作出置信度为P=1-α的总体平均数的区间估计为
当样本为小样本且总体方差σ2未知时, σ2需由样本方差s2来估计,于是置信度为P=1-α的总体平均数μ的置信区间可估计为
两个总体平均数差数µ1-µ2的区间估计和点估计
求 两个样本为大样本 或σ12、σ22已知,在置信度P=1- α下,两个总体平均数差数µ1-µ2的区间估计为
一个总体频率p、两总体频率差数p1-p2的区间估计和点估计
当样本容量较小或者np、nq远小于30时,对总体频率p进行的区间估计和点估计,需要做连续性校正,其校正公式为
方差的同质性检验
一个样本方差的同质性检验
两个样本方差的同质性检验