导图社区 Day15-2秩相关、16、17简单线性回归、多重线性回归分析、18现况调查统计策略
这是一篇关于Day15-2秩相关思维导图,包括:16、17简单线性回归、多重线性回归分析、18现况调查统计策略的思维导图。
本思维导图包括:Day19 病例对照研究、20logistic、21 病例对照研究统计分析过程、32 回归模型建立基本过程(队列)。
这是一篇关于Day14 观察性研究、D15线性相关的思维导图,包括:主要方法、Day 15—1相关分析:直线相关分析(正态分布数据)。
社区模板帮助中心,点此进入>>
中国特色社会主义
马克思主义原理
小儿常见病的辩证与护理
蛋白质
均衡饮食一周计划
考研数学重点考点知识总结归纳!
消化系统常见病
数据结构
耳鼻喉解剖与生理
法理学读书笔记
Day15-2秩相关
偏态数据案例
操作
等级数据案例
正态性检验p小于0.05,所以为偏态数据
案例一中有关系,案例二中没关系,原因是数据从定量转到等级后会丢失数据
小结
Day16、17简单线性回归、多重线性回归分析
Day 16 简单线性回归分析
一、直线回归
1.概念
在两个变量X、Y存在着线性关系是,建立两变量的关系函数( X 称之为自变量,Y是因变量)
研究应变量 Y 对自变量 X 的数量依存关系,即 Y 是依赖于×的改变而改变
回归关系往往是因果关系, X 是因, Y 是果
2.适用类型
结局变量为定量变量/研究变量间的线性数量依存关系/常见于现况调查与队列研究/残差符合正态性、方差齐性和独立性
二、线性回归函数(方程)
方程中的X为自变量,Y 为当X取某一值时应变量Y的总体均数估计值,称为Y的预测值(不是真正的Y)。a为截距,即当X= 0时Y的平均估计值。b为称斜率,统计学上称为回归系数,是当X每改变一个观测单位时所引起的Y的改变量,它是回归分析中最重要的统计量,表明X对Y的影响力
三、直线回归分析的基本过程(首先,描绘散点图,了解线性关系)
其次,计算a和b值,构建回归方程
求a、b的过程就是拟合的过程
构建回归方程即建模
求解 a 、 b 实际上就是“合理地”找到一条能最好地代表数据,点分布趋势的直线。
该过程称为拟合过程,是回归分析的核心任务,所形成的方程(函数),可以称之为“统计模型“
拟合的基本原理
线性回归分析注意的问题
回归方程应该有实际意义(通常需要有因果关系),仅相关不能进行回归。 回归分析要符合四大条件:线性(linear)、独立性(independent) 、正态性(normal) 、方差齐性(equal variance) ——“LINE”。
四、SPSS操作
案例
1.分析-回归-线性
2.①血糖是结果变量,放入因变量 ②胰岛素是原因变量,放入自变量 ③选项可以计算预测值和残差
3.点击后出现3个表(结果分析)
建模成功的意思就是这个方程是有意义的(先求出方差,还需要证明方差有意义)
给出了回归方程的截距
五、总结
1.关联性分析方法
1||| t检验
分类变量—正态定量资料关系
2||| F检验
3||| 卡方检验
分类变量—分类变量资料关系
4||| 秩和检验
分类变量—偏态定量资料关系
分类变量—等级变量资料关系
5||| 直线/秩相关分析法
分析关系的有无及大小
组间有差别 即为有相关
2.基本关联性分析方法
t、F、卡方、秩和、直线相关、秩相关
针对不同类型的变量开展相 关分析,研究关系的有无及 大小
3.高级关联性分析方法
简单线性回归分析
基于函数的方法开展关联性 分析,研究关系的有无及影 响程度
全部为单因素的关联性分析手段
Day 17 多重线性回归分析
一、多重线性回归
1.应用案例
2.多因素线性回归模型
3.应用条件
线性(linear)、独立性(independent) 、正态性( normal)、方差齐性(equal variance)—— "LINE”。 线性——自变量与应变量的关系是线性的。用散点图判断。 独立性——任意两个残差值互相独立。常利用专业知识判断。 正态性——要求残差服从正态分布。常用残差图分析。 方差齐性——要求残差的方差齐性。用散点图或残差图判断。
4.多元回归分析步骤
(1)线性关系描述 (2) 用各变量的数据建立线性回归方程(3)对总的方程进行假设检验 (4)回归分析应用条件诊断
二、案例分析
1.案例
2.案例分析
当X是定量或等级数据时,绘制散点图
3.绘制散点图
本例开展血压、年龄、和BMI指数的散点图分析(SPSS操作:图形-旧对话框-散点图-矩阵图)。结果发现,体重指数、年龄与血压的线性关系成立。
性别属于定性数据,所以不纳入
三、SPSS操作
2①血压是结果变量,放入因变量 ②年龄、性别和体重指数是原因变量,放入自变量 ③选项可以计算预测值和残差
3.结果分析
标准化系数绝对值越大,说明对血压的影响越高
4.R^2和方差分析的P值
同1
①血压是结果变量,放入因变量 ②年龄、性别和体重指数是原因变量,放入自变量 ③统计:软件默认勾选模型拟合计算R^2,同时有必要进行残差的独立性分析德宾沃森检验(Durbin-Watson)
“图”:可以绘制残差图和残差直方图、QQ图。选择右侧的“图”按钮,将“*ZRESID”选入Y轴,将“*ZPRED”选入X轴(①)(*ZRESID表示标准化残值、*ZPRED表示标准化预测值);②选择直方图(若选择正态概率,将绘制QQ图)
“选项”:可以计算预测值和残差
规范表达
四、总结
探讨因果关系,分析影响有无及大小
同时探讨多个影响因素一贴近真实世界,提高效率
预测与分类:构建良好的预测模型
Day18 现况调查统计策略
案例分析
将单因素分析中有意义的挑出来再进行多因素分析