导图社区 医学统计学第四章计量资料的统计推断
《医学统计学》均数的抽样分布与标准误、t分布、参数估计、假设检验、t检验、假设检验的注意事项 的概括 有错误的地方欢迎大家帮忙指正,希望可以帮到大家!!
编辑于2022-04-13 21:39:34计量资料的统计推断
均数的抽样分布与标准误
抽样误差:由个体变异产生的、抽样造成的样本统计量与总体参数的差别。(抽样误差是不可避免的)
抽样误差的分布规律:(中心极限定理)从任意总体中随机抽样,当样本含量足够大时,样本均数近似服从正态分布。
标准误
均数的标准误:为了区别个体观察值之间变异的标准差与反映本均数之间变异的标准差,将后者称为均数的标准误。 总体标准差未知时,用样本标准差S估计
率的标准误:样本率的标准差称为率的标准误,可用来描述样本率抽样误差的大小。(率的标准误越小,则率的抽样误差越小) 总体率未知,用样本率p来估计
标准差与标准误的区别(当n不变,标准差越大,标准误越大)
t分布
t分布的图形与特征
t分布是一簇曲线
由自由度n决定
n越小,t分布越分散,t分布的峰部越矮尾部越翘
当n→¥时,t分布逼近Z分布
单峰分布,以0为中心,左右对称
t界值特点
参数估计
参数估计指由样本统计量估计总体参数
点估计:使用单一的数值直接作为总体参数的估计值。(没有考虑抽样误差,无法评价其可靠程度)
区间估计
指按预先给定的概率(1-α),计算出一个区间,使它能够包含未知的总体参数。
可信区间:事先给定的概率1-α称为可信度(通常取0.95或0.99),计算得到的区间
准确度:用可信度(1-α)表示,即区间包含总体均数的理论概率大小
精确度:即区间的宽度,愈窄愈好
总体均数可信区间估计
总体率的区间估计
小样本率的区间估计
大样本率的区间估计
两总体率差值的区间估计
两总体均数差值的区间估计
假设检验
基本原理:是利用小概率反证法思想,从问题的对立面(Ho)出发间接判断要解决的问题(H1)是否成立。然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。
基本步骤
建立假设(Ho、H1)和确定检验水准α (一般α=0.05)
选择检验方法和计算检验统计量
根据P值做出统计推断
假设检验中的两类错误
Ⅰ类错误和Ⅱ类错误
Ⅰ类错误:拒绝了实际成立的Ho,即“弃真”,“假阳性错误”,概率大小为α。相应推断正确的可能性为1-α(可信度)
Ⅱ类错误:没有拒绝实际不成立的Ho,即“存伪”,“假阴性错误”,概率大小为β,1-β(把握度,检验效能)
α越小,β越大 同时减小α和β,唯一方法是增加样本量n
检验效能:指当不同总体间确实有差别时,按规定的检验水准α能发现其差别的概率,其值为1-β
t检验
单样本t检验
适用于来自正态分布的某个样本均数X与已知总体均数μ的比较
自由度
配对样本均数t检验
适用于配对设计的计量资料
配对设计类型
同源配对:同一受试对象或同一标本的两个部分分别接受两种不同的处理
异源配对:两同质受试对象分别接受两种不同的处理
自由度
两独立样本均数t检验
适用于完全随机设计两样本均数的比较
条件
独立性:观察值之间是互相独立的
资料来自正态分布
两总体方差相等,即方差齐性相等
自由度
假设检验的注意事项
严谨的研究设计(假设检验结论正确的前提)
检验方法的选用及其适用条件
双侧检验与单侧检验的选择
假设检验的结论不能绝对化(概率性)
正确理解P值的统计意义
正确理解专业结论与统计结论的区别
统计结论有意义,专业结论无意义,可能由于样本含量太大或设计不合理造成,那么最终结论就无意义;
统计结论无意义,专业结论有意义,则可能由于样本量较小或误差过大造成。
可信区间与假设检验的区别和联系
可信区间进行量的推断,用界值估计区间,说明总体均数所在的范围(定量)
假设检验进行质的推断,用界值判断P值大小,进而推动总体均数是否不同(定性)