导图社区 统计学总结
医学统计学第九版个人总结,本总结涵盖生存分析(含Cox回归、生存曲线比较)、三大回归模型(线性/Logistic/Cox)的对比与应用,重点解析变量筛选、参数估计及假设检验包含关键概念定义、课后习题精讲、简答题及案例分析高频考点,并强调注意事项如样本量计算、终点事件明确定义等适合快速梳理多元回归、相关分析及生存率估算方法,附分阶段复习指南(复习15模块),助你精准把握统计常用指标与模型差异!
编辑于2025-09-25 09:06:43药理学中枢神经系统表格总结,【中枢神经系统药物全览】从镇痛消炎到精神调节,这些药物守护大脑健康!内容涵盖:1.中枢神经系统药物表格系统分类速查2.解热镇痛抗炎药和抗痛风药对抗疼痛与炎症3.中枢镇痛药强效缓解剧痛4.抗精神失常药稳定情绪思维5.治疗退行性疾病药延缓阿尔茨海默等进展6.抗癫痫药和抗惊厥药控制神经异常放电7.镇静催眠药与促觉醒药调节睡眠与清醒节律一表掌握神经药物关键信息!
医学统计学推断部分复习总结,"统计推断的核心:从数据中挖掘真相!本文系统梳理统计推断要点,涵盖参数估计(可信区间计算、中心极限定理应用)、假设检验(z检验、两类错误控制)和方差分析(变异分解思想)重点解析:①置信区间与医学参考值范围的区别②标准差与标准误的异同③多重比较替代t检验的原因④不同设计类型的变异分解附统计描述技巧(频数表、直方图绘制)和资料类型处理(计量/计数/等级资料),助你掌握数据分析底层逻辑。
医学统计学个人总结,医学统计学的核心:从数据中发现真相!本文涵盖统计基础到实践应用,包括总体与样本、同质与变异、抽样误差等核心概念重点解析统计工作四步骤(设计、收集、整理、分析)和两类统计方法(描述与推断),详解t检验、卡方检验等方法的适用场景特别探讨参数估计(点估计/区间估计)与假设检验的完整流程,以及不同资料类型(定量/定性)的描述技巧理解这些工具,助你准确分析医学数据差异!
社区模板帮助中心,点此进入>>
药理学中枢神经系统表格总结,【中枢神经系统药物全览】从镇痛消炎到精神调节,这些药物守护大脑健康!内容涵盖:1.中枢神经系统药物表格系统分类速查2.解热镇痛抗炎药和抗痛风药对抗疼痛与炎症3.中枢镇痛药强效缓解剧痛4.抗精神失常药稳定情绪思维5.治疗退行性疾病药延缓阿尔茨海默等进展6.抗癫痫药和抗惊厥药控制神经异常放电7.镇静催眠药与促觉醒药调节睡眠与清醒节律一表掌握神经药物关键信息!
医学统计学推断部分复习总结,"统计推断的核心:从数据中挖掘真相!本文系统梳理统计推断要点,涵盖参数估计(可信区间计算、中心极限定理应用)、假设检验(z检验、两类错误控制)和方差分析(变异分解思想)重点解析:①置信区间与医学参考值范围的区别②标准差与标准误的异同③多重比较替代t检验的原因④不同设计类型的变异分解附统计描述技巧(频数表、直方图绘制)和资料类型处理(计量/计数/等级资料),助你掌握数据分析底层逻辑。
医学统计学个人总结,医学统计学的核心:从数据中发现真相!本文涵盖统计基础到实践应用,包括总体与样本、同质与变异、抽样误差等核心概念重点解析统计工作四步骤(设计、收集、整理、分析)和两类统计方法(描述与推断),详解t检验、卡方检验等方法的适用场景特别探讨参数估计(点估计/区间估计)与假设检验的完整流程,以及不同资料类型(定量/定性)的描述技巧理解这些工具,助你准确分析医学数据差异!
统计学总结
复习思路
模块
基本概念
第一章
统计描述
定性资料的统计描述
定量资料的统计描述
统计表和统计图
表述的另一种方式
统计推断
参数估计
正态分布和医学参考值范围
假设检验
重点
假设检验的使用范围
资料类型不同
单组/多组资料比较
设计方式不同
完全随机设计
配对设计
随机区组设计
分布类型不同
正态分布,方差齐
正态,方差不齐
不正态,方差不齐
假设检验步骤
建立假设检验,确定检验水准
计算统计量
各类假设检验方法假设统计量计算公式及基本思想
确定P值,得出推断结论
如果P<0.05,则按α=0.05的检验水准拒绝H0,接受H1,两者之间的差距有统计学意义,认为....(专业结论)
线性回归
线性回归模型有统计学意义,认为两者之间有线性回归关系
检验类型
t检验
特殊z检验
方差分析
卡方检验
秩和检验
非参数检验
分析多个变量之间的关系
两变量之间
线性回归和相关
自变量
给定值
II类
随机变量
正态分布
因变量
符合正态分布的随机变量
线性相关
自变量和因变量均为服从正态分布的随机变量
logistic分析
自变量
连续型变量
有序等级变量
无序等级变量
因变量
二分类变量(多分类变量)
多个变量
多元线性回归
cox回归
生存分析
问答题重点
案例分析
基础设问
第一问
假设检验
资料类型
设计类型
选择什么样的检验方法,写出假设检验
画统计表
分析选用方法是否有错,理由及选用某种方法理由
I类错误和II类错误分析,两两之间的t检验增加了犯什么错误的概率?
第二问
logistic分析
自变量、因变量的类型及自变量选用原则
OR值的计算
注意事项等等
多元线性回归
如何比较不同自变量对因变量的作用大小
校正回归系数
简答题
往年题
重点内容
复习1
线性回归、多元线性回归、生存分析再巩固(结合问答题、选择题)
3h
复习2
正态分布及医学参考值范围、t检验、方差分析、卡方检验、秩和检验复习
重点
假设检验步骤及表述
选用范围及注意事项
4h
复习3
基本概念、统计指标(集中趋势<均数:算数均数、几何均数;中位数>离散趋势<方差、标准差、四分位间距、极差>定性资料的描述(率、构成比、比数比、危险比等)·
2h
统计表和统计图的原则、选用及区别、概念
复习4
名词解释、问答题、案例分析巩固3h
复习5
往年题的选择、练习题的问答题及选择、资料巩固整体
1h
总计
13h
线性回归和相关
含义
对两变量之间的关系进行分析
线性回归
可以用直线方程描述两变量间依存变化的数量关系,这样的方程为线性回归方程
变量要求
因变量
正态分布的随机变量
自变量
正态分布的随机变量
给定值
参数估计
最小二乘法
各实测点到回归直线的纵向距离的平方和最小
假设检验
方差分析
变异分解
SS总=SS回归+SS残差
基本思想
如果X和Y之间无线性回归关系,则SS回归和SS残差都只包含随机因素对Y的影响,因此MS回归=MS残差,如果差别过大则不能用随机波动解释,则X和Y之间有线性回归关系
统计量
F=MS回归/MS残差,v回归=1,v残差=n-2
t检验
tb,v=n-2
线性相关
不要求由X估计Y,而是关心X和Y之间的是否具有直线相关性
直观描述
散点图
变量要求
双变量正态分布
参数估计
相关系数
Pearson积差相关系数
指说明两个具有直线相关关系的数量变量之间相关方向和密切程度的统计量,用r表示
r绝对值越接近1表示关系愈密切
假设检验
t检验
零假设ρ=0
线性回归的应用
分析两变量之间是否存在线性数量变化关系
利用回归方程由自变量X预测Y,必要时可以做区间估计
利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制X来限定Y
线性相关的运用
适用于两个变量都服从正态分布的资料
r值的实际意义根据具体问题而定
相关系数只能描述相关方向和密切程度,但不能说明因果关系
回归和相关的区别和联系
同一资料进行分析
b和r的正负号相同
b和r可相互转化b=rSY/SX
相关和回归可以相互解释
决定系数R2=SS回归/SS总
表示回归平方和在总平方和中所占的比重,可以从回归的角度对相关系数做进一步解释
R2表示因变量的变异中能用自变量解释的比例
自变量的区别
线性相关不分主次,线性回归两者之间有依存关系,分主次
多元线性回归
研究一个因变量与多个自变量之间线性依存关系的统计方法
可以对自变量的作用进行评价
标准化回归系数
预测和判断
多元回归模型
偏回归系数β1..βm
βj表示在其他变量保持不变时,自变量Xj变化一个单位时Y的平均变化量
应用条件
Y与X1到Xm之间有线性关系
各观测值之间相互独立
任意一组自变量取值,Y服从正态分布且方差齐=残差服从正态分布,方差固定
参数估计
最小二乘法
假设检验
模型检验
方差分析
整体检验Y与m个自变量之间是否存在线性回归关系
F=MS回归/MS残差,前者v=m,后者v=n-m-1
零假设
H0:β1=β2=..βm=0
备择假设
H1:β1..βm之间至少有一个不为0
单个回归系数检验(偏回归系数检验)
对每个自变量进行假设检验
F检验
偏回归平方和Uj(Xj单独引起的回归平方和改变量)F=Uj/SS残差/(n-m-1)
t检验
tb=bj/Sbj
标准化回归系数
比较各自变量对因变量的作用大小,消除了变量度量衡和各自变异程度的影响
复相关系数
全部自变量的线性组合和Y的密切程度,为决定系数的平方根
决定系数
反映线性回归方程在多大程度上解释Y的变异性
多元逐步回归
评价回归效果
校正决定系数
注意事项
应用条件
因变量为连续性变量,服从正态分布,方差齐
独立,对于传染性疾病谨慎分析
样本含量
样本含量为自变量的5-10倍
定性变量的数量化
自变量
连续性变量
分类变量
二分类
赋值1,0
多分类
哑变量k-1
有序
赋值1,2,3,按连续性变量处理
化作哑变量
多重共线性
变量筛选
子主题
logistic回归分析
定义
概率型非线性回归,研究二分类因变量和多个影响因素之间关系的一种多变量分析方法
特点
模型参数具有明确现实意义(OR)
变量
因变量
二分类定性变量
总结
数据的类型
计量资料
定量变量
计数资料
二分类定性变量
无序多分类定性变量
等级资料
有序多分类变量
自变量
二分类定性变量
使用0,1编码
多分类定性变量
转化成哑变量
有序变量
当做连续变量或者哑变量处理
定量变量
使用原始观测值
优点
简单,能保持数据的完整性,回归效果理想,假设检验效果可靠
缺点
参数实际意义不够明确
将连续变量按取值区间分为不同等级组,按1,2,..给分,接着按连续变量进行处理
将连续变量按取值区间分为g个组,化作g-1个哑变量处理
注意事项
当g>2时,不能用常规的方法进行变量筛选,而是而应将g-1个哑变量作为一个整体,检验其是否引入回归模型
回归模型
化简公式logit(P)=ln(P/1-P)
-1<P<1,Logit(P)无数值界限
模型参数的意义
疾病的基准状态β0
回归系数βj(j=1,2.3...)的含义
当Xj改变了一个单位时Logit(P)的改变量,与衡量危险因素作用大小的比数比OR之间有一个对应关系
暴露组和非暴露组的比数比
ORj=exp(βj)
βj>0,ORj>1
Xj是一个危险因素
βj越大反映OR值越大,暴露组和非暴露组发病比值越大,反映该Xj的危险程度越大
比较不同自变量则比较标准化回归系数
当发病率较低时,比数比近似于危险比
危险比RR=P1/P0
均是反应危险因素和暴露水平之间关联强度的指标
模型的参数估计和假设检验
参数估计
最大似然法
基本思想
建立一个样本的似然函数,当似然函数达到最大时参数的取值,即为参数的最大似然估计值
统计量L
比数比ORj的1-α可信区间
类似于t分布可信区间的表述
对统计结果进行理解
不能用回归系数大小反应哪一个自变量对因变量影响大→受到单位的影响
化作标准化回归系数进行比较绝对值
假设检验
似然比检验
基本思想
比较两种不同情况下似然比的对数值,看其差别大小,先拟合一个不含检验因素的模型求对数似然比函数值lnL0,再拟合一个包括检验因素的值lnL1,构建统计量G
构建的统计量G
Wald检验
基本思想
将βj与0进行比较
构建统计量z或卡方
注意公式的写法
两种检验方法的比较
似然比检验
适合单个变量,也适合多个变量同时假设检验
Wald检验
适合单个自变量的假设检验
在大样本情况下两者结构一样
变量筛选
筛选的统计量
似然比统计量或Wald统计量
筛选方法
向前选择法,向后选择法,逐步选择法
条件logistic回归
原理
针对配对或分层资料的一种分析方法
特点
不同匹配组的β0i可以不同,但内在假定每个危险因素的致病能力在不同匹配组中相同
与非条件logistic回归的区别
似然函数不同,一个是最大似然函数一个是条件似然函数
logistic回归的应用
流行病学危险因素分析
估计出某一因素不同水平下的OR或RR,适用于疾病的危险因素分析
可以矫正其他混杂因素或其他自变量影响后对疾病与危险因素做出分析
临床研究数据分析
可以调整混杂因素后对药物或治疗方法进行研究
药物或毒物的剂量反应分析
原理
药物或毒物的剂量-反应关系呈现“S”型logistic曲线
检验结构
有效剂量
剂量反应趋势分析
药物间协同或拮抗的作用关系
预测和判别
预测某事件发生的概率,如暴露在某危险因素下得病的概率
条件logistic不能用于估计概率
应用条件
大样本数据
因变量为二分类变量
独立
注意事项
变量的取值
样本含量
所有统计推断都建立在大样本基础上,样本越大分析结构越可靠
对于配对资料,一般样本的匹配组数为纳入方程的自变量的20倍以上
样本间的交互作用
交互作用定义
某一自变量对因变量Y的作用大小与另一自变量的取值有关
方法
在方程中加入乘积项
多分类logistic回归
无序多分类变量或有序多分类变量均可进行logistic回归
课后习题
logistic回归与线性回归区别
变量类型
logistic回归因变量为二分类变量,属于概率型非线性回归
线性回归因变量为连续变量,服从正态分布
应用
线性回归对资料分析比较细腻,既可用于大样本也可用于小样本,线性回归要求对不同的自变量取值、因变量服从正态分布和等方差
logistic分析对资料要求少,可以求出OR和RR值,具有明确实际意义,logistic要求大样本量
条件logistic应用的资料类型
配对资料
目的
控制混杂因素
生存分析
定义
将终点事件和出现终点事件所经历的时间结合起来进行分析
生存分析的基本概念
生存时间
规定的观察起点到终点事件出现所经历的时间
要明确起止点和时间单位
生存数据
类型
完全数据
从起点到出现终点事件所经历的时间
删失数据
由于某些原因无法观察到生存时间的数据(死于其他疾病、失访、观察结束时仍存活)
右上角标记+
特点
同时考虑生存结局和生存时间
可能含有截尾数据
不服从正态分布
统计常用指标
生存率
表示观察对象的生存时间大于t的概率S(t)
如果含有删失数据则分时段计算生存概率并相乘,因此又被称为累积生存概率
中位生存期
50%个体存活的时间
中位生存期越长则表示疾病预后越好,可以由生存曲线得到,生存曲线纵轴为50%时对应的横轴生存时间则为中位生存时间
名词解释原则
定义+意义+类型+如何得出+具体拓展
风险函数
生存时间已经达到t的观察对象在时刻t的顺时死亡率称为风险函数(hazard function)
生存率曲线及比较
生存率的估计方法
非参数法
寿命表法
大样本资料
Kaplan-Meier法
小样本资料或大样本且有精确生存时间
参数法
生存曲线
以随访时间为横轴,生存率为纵轴,将各个时间点对应的生存率连接起来的一条曲线
对所有死亡时间点估计生存率,其生存曲线呈阶梯式变化
高、下降平缓表示高生存率
低,下降陡峭表示低生存率
生存曲线比较
log-rank检验
基本思想
当假设检验H0成立时,根据在各个时刻尚存活的患者数和实际死亡数计算理论死亡数,然后将实际死亡数和理论死亡数进行比较
基本步骤
建立假设检验,确定检验水准
H0:S(t)=0,即两种...生存曲线相同
H1:S(t)≠0,即两种...生存曲线不同
计算检验统计量
卡方,自由度为n-1
确定P值,做出推断结论
breslow检验
比较
前者对远期差异敏感,后者对近期差异敏感,两者均是非参数法
注意事项
两者的应用条件相同,各组生存曲线呈比例风险关系,不能有交叉,有交叉时不做整体比较
多变量cox回归分析
半参数模型
总结(多变量的回归分析)
多元线性回归
logistic分析
cox回归分析
基本形式
h(t,X)=h0(t)exp(Z)
h0(t)
基础风险函数
X1=X2=Xm=0时在时刻t的风险函数
参数解释及相对危险度
与logistic分析类似,与风险比HR有对应关系
参数估计与假设检验
参数估计
偏似然函数
假设检验
似然比检验
Wald检验
步骤与logistic类似
注意事项
明确定义终点和起点事件
样本量的确定
一般在40例以上,要求样本量为协变量的5-20倍,两组资料比较最好例数差别不大
应用条件
cox回归分析要求资料满足比例风险恒定假设
如何检验:观察生存曲线是否交叉
因素间作用比较
标准化回归系数
课后习题
三种回归模型的比较
相同点
自变量可以是连续变量、有序分类变量和无序分类变量,为了将无序分类变量代入回归模型需化作哑变量,哑变量在回归模型中是一个整体,必须同时引入或同时剔除
当自变量之间存在较强的相关关系,可能导致共线现象
自变量之间可能存在交互作用,通常采用两个或两个以上自变量相乘的积作为交互作用项
均可采用逐步回归筛选变量,先考虑单变量分析再考虑多元回归分析
均可进行影响因素的分析、混杂因素的校正、预测分析
不同点
Cox回归模型和logistic回归模型的区别和联系
相似之处
估计出回归系数之后可以得到协变量对应的相对危险度
不同
logistic回归是一种概率模型,只考虑事件是否发生而不考虑事件发生所需要的时间
Cox回归利用了终点事件是否发生和生存时间,信息利用更为高效
Cox回归可以包含删失数据
多元和logistic回归的区别
因变量不同
因变量分布不同
正态分布和二项分布
参数估计和检验方法不同
参数意义不同
多元线性回归无实际意义
多元和Cox回归区别
生存时间通常不为正态分布
因变量类型和分布不同
能否运用删失数据
多元线性回归不能同时利用生存结局和生存时间