导图社区 医学统计软件 (详细版)
跟以前的相比更新了一遍,现在是超绝零基础也能包会的教程版,有助于帮助您熟悉知识要点,加强记忆。有需要的同学,可以收藏下哟。
编辑于2025-06-17 11:00:45跟以前的相比更新了一遍,现在是超绝零基础也能包会的教程版,有助于帮助您熟悉知识要点,加强记忆。有需要的同学,可以收藏下哟。
这是一个关于药理学中枢神经药物的思维导图,详细介绍了遗传物质本身的变化及由此引起的变异,特别是可遗传的变异,并提到了两种主要类型的变异:自发突变和诱发突变。自发突变具有发生过程长、发生率极低的特点,与物种进化有关。而诱发突变则相反,发生过程短、发生率高,对人类有利有弊。描述了外源化学物致突变的类型,包括直接致突变物和间接致突变物。同时,探讨了外源化学物致突变的作用机制,以及可能导致的后果,如肿瘤、衰老、动脉粥样硬化以及新生儿畸形、死胎、发育迟缓、流产等。
这是一个关于毒理学第八章外源化学物致突变作用的思维导图,包含外源化学物致突变类型、 外源化学物致突变作用机制、机体对致突变作用影响等。
社区模板帮助中心,点此进入>>
跟以前的相比更新了一遍,现在是超绝零基础也能包会的教程版,有助于帮助您熟悉知识要点,加强记忆。有需要的同学,可以收藏下哟。
这是一个关于药理学中枢神经药物的思维导图,详细介绍了遗传物质本身的变化及由此引起的变异,特别是可遗传的变异,并提到了两种主要类型的变异:自发突变和诱发突变。自发突变具有发生过程长、发生率极低的特点,与物种进化有关。而诱发突变则相反,发生过程短、发生率高,对人类有利有弊。描述了外源化学物致突变的类型,包括直接致突变物和间接致突变物。同时,探讨了外源化学物致突变的作用机制,以及可能导致的后果,如肿瘤、衰老、动脉粥样硬化以及新生儿畸形、死胎、发育迟缓、流产等。
这是一个关于毒理学第八章外源化学物致突变作用的思维导图,包含外源化学物致突变类型、 外源化学物致突变作用机制、机体对致突变作用影响等。
医学统计软件应用
统计推断
以样本为基础,进行关于总体特征和参数的推断
假设检验
概念:对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设
实质:反证法与概率学小概率理论的一个完美结合
做出判断的依据是基于小概率事件原理。小概率事件一般是指发生概率 ≤0.05或0.01(检验水准)的事件。由于事件A发生的概率是如此之小,以至于 在一次试验(抽样)时,我们往往认为它(事件A)不会发生。
即首先假设两总体无差别(反证法),然后根据样本资料计算获得这样一份样本的概率值,当概率值特别小时,根据小概 率事件在一次实验中不(大)可能发生的推断原理(小概率事件原理)就推翻原先建立的假设(即两总体无差别的假设),从而认为两总体有差别。
步骤:
建立检验假设,确定检验水准
计算检验统计量
研究目的:差异性?关联性等
设计类型:单个?两样本等
资料类型:定量?定性?
适用条件:正态性?方差齐性等
确定P值,作出推断
p值的p用大写,倾斜!!
单样本定量变量的假设检验
正态性检验
步骤
1.建立检验假设,确定检验水准
H0 :当前资料所来自的总体服从正态分布
H1 :当前资料所来自的总体不服从正态分布
2. 计算检验统计量
分析-描述统计-探索-变量投入因变量列表-图(勾选含检验的正态图,茎叶图默认勾选,大样本时可以勾选直方图
3≤n≤50时,W检验
50≤n≤1000,D检验
多样本时各看各的
3. 确定P值,做出推断
例:由于样本含量n =11<50,因此使用SW检验 。p =0.124>0.10,按照检验水准α=0.10 ,不拒绝 H0 ,差异无统计学意义, 尚不能认为当前资料所来自的总体不服从正态分布,暂时认为满足正态性
结果
当n ≤ 50时,结果以Shapiro-Wilk (S-W)检验为准
当n > 50时,结果以Kolmogorov- Smirnov (K-S)检验为准
就是D检验
当n > 5000时,SPSS只显示Kolmogorov- Smirnov (K-S)检验结果
数据满足正态分布
单样本t检验
概念
已知一个总体(B) 现在在一个未知的总体(A)中随机抽取了一个已知的样本(C) 问总体A与总体B之间有无差异?
适用于:某样本均数X与已知总体均数μ0的比较;
步骤
1.建立数据文件
2.正态性检验
单样本t检验的适用条件为:样本数据来自服从正态分布的总体
3.单样本t检验
分析→比较平均值→样本(变量)放入检验变量,检验值填入已知总体的均值
由spss计算得知,t值为3.06,p值为0.124
经过计算得P=xx,按照检验水准 α=0.05 ,xx<0.05,拒绝 H 0 ,接受 H 1 ,差异有统计学意义,可以认为当前方法的药物浓度与标准浓度有差别。
数据不满足正态分布
单样本资料的符号秩和检验
概念
推断样本中位数与已知总体中位数(常为标准值或大量观察的稳定值)有无差别
适用于:不满足单样本t检验应用条件的单样本定量资料 的差异性检验
步骤
1.建立数据文件
2.正态性检验
由于样本含量 n<50, 因此使用SW检验,P=x<0.10,按照检验水准α=0.10,拒绝H0,接受H1,差异有统计学意义,可以认为样本差值资料所来自的总体不服从正态分布。
3.单样本t检验
分析→非参数检验→单样本→目标(定制分析)→字段(变量放入检验字段)→定制检验(比较中位数)
经过计算得P=xx,按照检验水准 α=0.05 ,xx<0.05,拒绝H0,接受H1,差异有统计学意义
两样本定量变量的假设检验
两独立样本设计定量资料
概念
两独立样本设计为两个未知的总体(A与B)中随机抽取了一个已知的样本(C与D),而所问的问题是总体A与总体B之间有无差异?
适用于:不满足单样本t检验应用条件的单样本定量资料 的差异性检验
两组均服从正态分布
两总体方差相等
两独立样本t检验
步骤
1.建立数据文件
2.正态性检验及方差齐性检验
3.两独立样本t检验
(正态)分析-探索-变量放因变量列表,分组放因子列表-图(茎叶图直方图,含检验的正态图)(可以此时在这里用莱文-未转换,检验方差齐性,也可以不做,方差齐的结果只看基于均数的)
分析→比较平均值→两独立样本t检验→样本(变量)放入检验变量,分组放入分组变量组1输1,组2输2
看第一行的结果
两总体方差不相等
两独立样本t’检验
步骤
1.建立数据文件
2.正态性检验及方差齐性检验
3.两独立样本t’检验
与上方的一致,只做了一次做出了三个检验(方差齐,t,t’)分析→比较平均值→两独立样本t检验→样本(变量)放入检验变量,分组变量组1:1,组2:2
看第二行的结果
可以不先做方差齐性检验,因为检验结果里第一行显示了方差齐,第二行方差不齐(t’检验)
两组不全服从正态分布
两独立样本秩和检验
步骤
1.建立数据文件
2.正态性检验及方差齐性检验
3.两独立样本秩和检验
分析→非参数检验→旧对话框→样本(变量)放入检验变量,分组变量组1:1,组2:2,检验类型:曼惠特尼
配对设计定量资料的假设检验
差值服从正态分布
配对设计t检验
步骤
1.建立数据文件
两组变量,一组一列,正常录入(前面对子号写上)
2.计算差值
转换→计算变量
3.差值的正态性检验
经检验,可以认为差值服从正态分布。故而应选用配对设计t检验 的方法(差值正态即可,原组不正态也可以。当差值正态时,不管原组正不正态,都按照正态描述)
对差值进行单样本t检验也可以,检验值为0(也可以为了看临床意义,将检验值按照实际意义差值取)
4.配对设计t检验
分析→比较平均值→成对样本T检验 →样本(变量)放入配对变量
差值不服从正态分布
配对设计符号秩和检验
步骤
1.建立数据文件
两组变量,一组一列,正常录入(前面对子号写上)
2.计算差值
转换→计算变量
3.差值的正态性检验
经检验,可以认为差值不服从正态分布。故而应考虑选用配对设计 的符号秩和检验
所以描述时用中位数和四分位数
4.配对设计的符号秩和检验
分析→非参数检验 →旧对话框→两个相关样本 →样本(变量)放入配对变量(配对1,两个变量在一行里),威尔科克森
两组样本建议用旧对话框,操作简单,多组只能用上方的,因为旧对话框不能进行两两检验
多样本定量变量的假设检验
多组独立样本资料的假设检验
各组均服从正态分布
多个总体方差相等
单因素方差分析
步骤
1.建立数据文件
2.正态性检验及方差齐性检验
(正态)分析-探索-变量放因变量列表,分组放因子列表-图(茎叶图直方图,含检验的正态图)(可以此时在这里用莱文-未转换,检验方差齐性,也可以不做,方差齐的结果只看基于均数的)
3.单因素方差分析
分析→比较平均值 →单因素ANOVA检验 →样本(变量)放入因变量列表,因子放组别→事后比较(选一个正确的两两比较)→选项→描述、方差齐性检验→确定
第一个表:描述,第二个表:方差齐性检验,第三个表:方差分析(ss,自由度,MS,F,p经软件计算可得,统计量F=xx,按照检验水准α=0.05,<α,拒绝H0,接受H1,差异有统计学意义,可以认为这几个总体不等或不全相等),第四个表,两两比较
SNK:每列是检出的组别代表处于同一个总体,若多个数值(均值)处于同一列,意味着它们来自同一总体。若该列,下方只有一个数值(均值),那下方的p=0,意味着它与自己本身比,所以是1。snk只能得到结论,对于两两比较间的具体p值要结合LSD
bonferron和sidaki:思想是校正检验水准α’,而软件将p值校正了,所以在软件中仍和0.05比较。
dannnet:和我们选择的处理组两两比较。
4.单因素方差分析的多重比较
各总体方差不全相等
各组不全服从正态分布
多组独立样本比较的秩和检验
步骤
1.建立数据文件
2.正态性检验及方差齐性检验
3.Kruskal-Wallis H检验
分析→非参数检验→独立样本 →目标,定制分析→字段,使用自定义字段分析,变量放入检验字段,分组放入组→设置,定制检验,Kruskal-Wallis H检验全部成对
点开后下面可以选择成对比较
随机区组设计资料的假设检验
各组均服从正态分布
多个总体方差相等
随机区组设计资料的方差分析
步骤
1.建立数据文件
处理组一列数字,区组一列数字,变量一列
2.正态性检验及方差齐性检验
将变量放入因变量,处理组放进因子做一次,将变量放进因变量,区组放进因子再做一次(理论上两个都做,实际上区组的可以不做)
3.随机区组设计资料的方差分析
分析→一般线性模型 →单变量→样本(变量)放入因变量列表,处理组和区组都放固定因子→模型里勾选定制,类型选择主效应,处理组和区组放入模型(为了告诉软件不做交互作用,否则会报错)→继续→事后比较,处理组放入各项的事后检验→继续
第二个表:主体间效应检验(最左边一列只看处理组、区组、误差,修正总计)-若区组的p>0.05无统计学意义,说明配伍失败。
4.随机区组设计资料的方差分析的多重比较
各总体方差不全相等
各组不全服从正态分布
随机区组设计资料的秩和检验
步骤
1.建立数据文件
更换数据录入形式,按照配对录入,一行一区组
2.正态性检验及方差齐性检验
3.随机区组设计资料的秩和检验
分析→非参数检验→相关样本 →目标,定制分析→字段,使用自定义字段分析,变量放入检验字段→设置,定制检验,比较分布Friedman M检验,多重比较成对比较
定性变量的假设检验
两组独立样本设计定性资料的假设检验
两组独立样本设计二分类资料的假设检验
步骤
1.建立数据文件
如果直接有原始资料,处理和疗效为变量,一共n行
导入Excel的时候确保Excel是关闭的
2.数据加权
数据→个案加权→选择个案加权系数,频数放入频率变量
3.χ2检验
分析→描述统计→交叉表,变量(处理)放入行,列(疗效) →统计,选择卡方→字单元格,选择实测,期望,百分比选择行(因为愈合率除以行合计所以选择行)
结果
Pearson和校正用渐进显著性,Fisher用精确显著性
看占处理的百分比(行百分比)
两组独立样本设计无序多分类变量的假设检验
步骤
1.建立数据文件
2.数据加权
数据→个案加权→个案加权系数,频数放入频率变量
3.χ2检验
分析→描述统计→交叉表,变量放入行,列 →统计,选择卡方→字单元格,选择实测,期望,百分比选择行
结果
两组独立样本设计有序多分类变量的假设检验 (两独立样本资料的秩和检验)即Wilcoxon秩和检验
步骤
1.建立数据文件
2.数据加权
3.Wilcoxon秩和检验
分析→非参数检验→旧对话框 →2个独立样本→样本(变量)放入检验变量,分组变量组1:1,组2:2,检验类型选择选择曼惠特尼
多组独立样本设计定性资料的假设检验
多组独立样本设计无序分类资料的假设检验
步骤
1.建立数据文件
2.数据加权
数据→个案加权→个案加权系数,频数放入频率变量
3.χ2检验
分析→描述统计→交叉表,变量(处理)放入行,疗效放入列 →统计,选择卡方→字单元格,选择实测,期望,百分比选择行
结果
下面提示了几个单元格期望计数小于5,最小期望数为多少
若T<5的格子大于20%,则选择精确,精确
4.进一步使用χ2分割法进行多重比较
要比几次,α除以几
选择变量视图,点击缺失,离散缺失值选择1/2/3,做卡方,注意结果的p值和α’比较
做完一定要关闭缺失
多组独立样本设计等级资料的假设检验
步骤
1.建立数据文件
2.数据加权
3.多组独立样本资料的秩和检验
分析→非参数检验→独立样本 →2个独立样本→目标,定制分析→字段,使用自定义字段分析,变量放入检验字段,分组放入组→设置,定制检验,克鲁斯卡尔ANOVA检验,全部成对
配对设计资料的假设检验
配对设计二分类变量的假设检验
步骤
1.建立数据文件
一组一列,一一配对
2.数据加权
3.配对χ2检验
分析→非参数检验→相关样本 →目标,定制分析→字段,使用自定义字段分析,变量(两个处理方式,不放频数)放入检验字段→设置,定制检验,麦克尼马尔检验
结果展开,检验统计为我们需要的配对卡方,渐进显著性为我们需要的p值
注意SPSS会全部进行校正,所以检验统计的卡方值是校正法的(无需我们再计算Pearson),但不影响结果的可靠性,因为校正法更保守,p值更大,当它<0.05时,更有理由拒绝H0
配对设计RxR的假设检验
步骤
1.数据文件
2.数据加权
3.直接采用描述统计交叉表
描述统计→交叉表→两个方法是无序的,一个放行一个放列→统计选麦克尼马尔McNemar,单元格不用动
两变量关联性分析
分析两个随机变量之间的关系,如体重与肺活量、年龄与血压之间是否存在线性联 系,以及此联系是正向还是负向以及联系的程度如何
线性相关
散点图
散点图能直观地看出两变量间的关系,因此研究两变量的关系应先绘出散点图,而后再确定两者的量化关系
线性相关系数
又称Pearson积矩相关系数,是定量描述两个变量 间线性关系密切程度和相关方向的统计指标。
相关关系密切程度
r 值为正 —— 正相关
r 值为负 —— 负相关
完全相关 ——| r |=1
高度相关 ——| r | ≥ 0.7
中度相关 ——0.4 ≤ | r | < 0.7
低度相关 ——0.2 ≤ | r | < 0.4
微弱相关 ——0 < | r | < 0.2
零相关 ——r =0
操作
1. 建立数据文件
2. 线性相关分析
(1)绘制散点图
图形→旧对话框→散点图,简单散点图→变量放入y组,x组(xy无影响)
(2)二元正态检验
都进行正态检验
(3)线性相关系数计算及假设检验
分析→相关,双变量→两个变量放入变量,相关系数选择皮尔逊,标记显著相关性
r=0.834,通过假设检验,计算得p<0.001,按照检验水准α=0.05,拒绝H0,接受H1
秩相关
不服从正态分布的资料,还有一个为随机定量变量和一个用等级表示的资料,此时都不宜使用Pearson积矩相关系数来描述两变量间的关联性,常用的方法是秩相关(rank correlation)分析。
秩相关分析,也称等级相关分析,采用Spearman秩相关系数rs来探讨两变量间的关联性
操作
1. 建立数据文件
2. 秩相关分析
分析→相关,双变量→两个变量放入变量,相关系数选择斯皮尔曼
定性变量的关联性分析
至少一个变量为无序变量的关联性分析
两个定量变量之间或定量变量与等级变量之间的关联性可用Pearson积矩相关系数或秩相关系数来描述;对于至少一个变量为无序分类变量的两分类变量关联性分析,通常是现根据交叉分类计数所得到的列联表进行两种属性独立性的χ2检验,然后计算关联系数。
操作
1. 建立数据文件
2. 数据加权
3.关联性分析
分析→描述统计→交叉表,变量放入行,列 →统计,选择卡方,列联系数,phi和克莱姆
2×2配对资料的关联性分析
操作
1. 建立数据文件
2. 数据加权
3.关联性分析
分析→描述统计→交叉表,变量放入行,列 →统计,选择卡方(是否有关联),Kappa(一致性情况),列联系数,phi和克莱姆(关联强度)
两有序多分类变量的关联性分析
操作
1. 建立数据文件
2. 数据加权
3.关联性分析
分析→描述统计→交叉表,变量放入行,列 →统计,选择卡方,相关性(可以不点),列联系数,phi和V
注意contingency coefficient是Pearson列联系数,Pearson R其实没有什么实际作用(可能是Pearson积矩系数) 近似p值-理论上需要对列联系数等也进行检验,但与此卡方检验的p值一致
gamma法不用选卡方,不用选相关性
简单线性回归
看谁是x,谁是y
散点图
图形→旧对话框→散点图,简单散点图→变量放入y组,x组
分析-回归-线性(注意这个下面的二元多元实际是二分类多分类,且都是非条件)-x,y-统计(估计值,置信区间,模型拟合,德宾沃森(验证独立))-图,残差散点图ZPRED放X,ZRESID放Y,直方,正态概率图
残差正态图→残差散点图(向Y轴添加参考线0,2,-2)→R:线性相关系数,R square:决定系数
看ANOVA,coefficients,注意tolerance意思是容忍度
多重线性回归
散点图
图形→旧对话框→散点图,矩阵散点图→全部放入矩阵变量
看Y是纵轴的一行,只要有一个有线性趋势就可以
分析-回归-线性(注意这个下面的二元多元实际是二分类多分类,且都是非条件)-x,y-统计(估计值,置信区间,模型拟合,德宾沃森(验证独立))-图,残差散点图ZPRED放X,ZRESID放Y,直方,正态概率图
R:负相关系数,R square:决定系数
自变量筛选-分析-回归-线性-xy进入后方法里有输入(强制进入)步进(逐步进入)
logistic回归
操作
单因素
数据加权
分析-回归-二元logistic(注意翻译问题,其实是二分类)-自变量X放协变量,因变量Y放因变量-选项-统计和图,Expβ置信区间(是OR的置信区间)-显示,在最后一个步骤-确定
二分类01赋值后,可以不用哑变量操作
看结果:只取所需,Block1(有x进来了)-第一个表看模型的p(似然比检验),第二个表不用管(广义决定系数),第三个表不用管,第四个表重点(回归系数,标准误,Wald卡方统计量,df要去掉,p值,OR点估计值,OR95置信区间)
多因素(单因素回归后有意义的放入多因素回归,不过写论文的时候要注意具体分析)
数据加权
某数据想增加几个单位,就除以几,计算变量
分析-回归-二元logistic(注意翻译问题,其实是二分类)-自变量X放协变量,因变量Y放因变量,方法选择向前:LR(基于似然比检验的向前逐步法)-选项-统计和图,Expβ置信区间(是OR的置信区间)-显示,在最后一个步骤-确定
哑变量操作(无序多分类必须哑,等级变量试研究目的而定,定量不能哑):分类-把需要哑变量化的选择进去-参考类别选择第一个,再点击变化量(指示符后面一定要出现first)-确定(该协变量后面出现cat说明已哑变量化)
看结果:只取所需,Block1(有x进来了)-第一个表看p(似然比检验),第二个表不用管(广义决定系数),第三个表不用管,第四个表重点(回归系数,标准误,Wald卡方统计量,df要去掉,p值,OR点估计值,OR95置信区间)
p值小于0.1大于0.05时,要谨慎
实际上多因素回归可用于调整混杂因素,在对想要得到的自变量与因变量之间先做单因素回归,再把其他混杂因素放进去做多因素回归。这个时候注意变量的实际意义要比统计意义重要,即使p值>0.05 它存在实际意义,也要保留作为调整因素(此时方法选择输入)
生存分析
生存曲线估计
寿命表法
数据加权
分析-生存分析-寿命表-时间放入时间,按10~1,定义状态(分组),1表示已发生-选项,选寿命表,生存分析,风险
风险曲线图要改成阶梯型
Kaplan-meier法
分析-生存分析-Kaplan-meier-时间放入时间,状态定义1为发生-选项,勾选生存分析表,平均值和中位数,四分位数,生存分析函数-比较因子选择秩的对数(log-rank)
cox比例风险回归分析
PH假定
分析-生存分析-cox回归-时间放入时间,状态定义1为发生-年龄组放入层-图,选择生存分析,负对数的对数
得到的图不能明显交叉
分析-生存分析-cox回归-时间放入时间,状态定义1为发生,自变量放入协变量,方法选择向前LR-选项,选择expB的置信区间(HR),在最后一个步骤
统计描述
统计描述(statistical description)是指利用统计指标、统计表、统计图等方法对资料进行系统地整理,以期了解数据的数量特征及分布规律,从而把数据中蕴含的变异和同质的特征准确地展现出来。 统计描述是进行进一步统计分析的基础。
定量资料的统计指标
集中趋势
用于描述一组定量资料的集中位置或平均水平。
算术均数
数量上的平均
几何均数
比例或倍数上的平均
①分析-比较平均值-平均值-因变量列表-选项-统计(几何平均值)-继续-确定 得出的结果xxx,报告时写1:xxx ②分析-报告-个案摘要-变量-统计(几何平均值)-继续-确定 先 频数加权
中位数
位次上的平均
离散趋势
用于定量资料变异程度大小的综合指标。
极差
四分位数间距
差
标准差
变异系数
集中趋势指标和离散趋势指标相结合,可以全面的描述定量资料的分布特征
正态分布资料
算术均数±标准差
偏态分布资料 分布不明资料 分布末端无确定值资料
中位数(四位分数间距) 中位数(QL,QU)
操作
SPSS步骤第一种方法
SPSS步骤第二种方法
SPSS步骤第三种方法
①分析-描述统计-频率-统计(勾选)-确定-继续 ②分析-描述统计-描述-选项(勾选)-确定-继续 ③分析-描述统计-探索-因变量列表-统计-确定-继续
定性资料的统计指标
率
表示某现象发生的频率或强度。
发病率
某一时期内(一般为一年)某人群中发生某病新病例的频率。
患病率
某一时点某人群某病的(新、旧)病例数与同期平均人口数之比。
死亡率
指某地某人群在一定时间内(一般为一年)的总死亡人数与该地同期平均人口数之比。
病死率
一定时期内,某病患者中因某病死亡的频率。
构成比
各构成部分在总体中所占的比重或分布。
相对比
描述两个有关指标的对比关系
R=(甲指标/乙指标) ×100%
甲、乙两指标可以是绝对数、相对数或平均数。 若甲指标大于乙指标,结果用倍数表示;若甲指标小于乙指标,结果用百分数表示;分子和分母不一定有相同的度量衡单位。
统计表
例表
统计图
直方图
直方图以长方形面积代表数量,各直方形面积与各组的数量成正比关系,用于表示连续型变量的频率分布情况。
例图
箱式图
箱式图可综合描述定量变量的平均水平和变异程度,还可显示数据中的离群值或极端值。用于各组数据的直观比较
例图
散点图
散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系,常用于双变量资料的相关分析
例图
线图
线图是用线段的升降来表示事物随时间的变化,或某现象随另一现象变化的情况。
普通线图
表示时间变化趋势和变化幅度
半对数线图
表示消长趋势或变化速度
定量资料
直条图
直条图用于反映相互独立的事物之间的数量对比关系,适用于离散型数值变量和分类变量。
百分条图
圆图
圆图以圆形总面积作为事物的整体,即100%,以圆内各扇形的面积表示事物内部各部分所占的比重
定性资料
操作
图形→旧对话框→需要图形
SPSS数据文件建立与基本操作
资料类型
定量变量
定性变量
分类资料
等级资料(有序变量)
常用统计软件简介
SAS
R
STATA
SPSS
SPSS统计软件概述
建立数据文件
一行一个体,一列一变量
直接法
先构建变量
数值型
字符型
后数据录入
度量
等级
计数
间接法
EXCEL导入与导出
基本统计分析
数据文件的编辑-合并文件(merge files)
纵向合并
数据-合并文件-增加个案(相同变量名会自动合并,不同变量可以进行配对)勾选原变量源(会显示原变量0新增变量1)-继续
横向合并
将id按照升序排列id-数据-合并文件-增加变量-按(关)键变量匹配个案-两个数据集中的个案……-将id导入键变量-勾选 两个文件都提供个案-继续
数据文件的编辑-拆分文件
数据文件的编辑-选择个案(select cases)
eg:筛出(留下)身高<170cm 数据-选择个案-如果条件满足-(按条件选择)-继续-输出-选定个案复制到新数据集-确定 按条件选择里**是乘方符号,&是and,Ⅰ是or 如果是汉字,要用英文引号括住
数据文件的编辑-计算变量(compute)
BMI
转换-计算变量-目标变量(新增一个新变量)-计算-确定
二分类时,可以=1,下方如果选择条件,I是或的意思,&是和的意思,要更改现有变量选择确定
数据文件的编辑-重新编码
重新编码:一般用于将定量变量转化为定性变量 转换-重新编码为不同变量-输出变量名称-变化量-旧值和新值-旧值(范围)新值1-添加-继续-确定
同时利用两个或更多指标联合
筛选个案,挨个编码
数据文件的编辑-排序个案(sort cases)
转换-计算变量-新建变量id-函数组casenum-确定
频率分布表的制作
先利用描述找到整组数据的最大值、最小值、全距以及样本含量。
a.利用样本含量确定组段数k(组段数一般设为8~12组为宜); b.利用R/k确定组距; c.第一个组段包括最小值;最后一个组段包括最大值; d.根据最小值确定第一组的下限
编码为不同变量
分析-描述统计-频率-统计 勾选范围,最大,最小-继续(自己定组距阻段) 转换-重新编码为不同变量-输出名称 组段 变化量 旧值 范围(注意区间)新值 用下限数字命名(转为定性时再选择输出变量为字符串)-继续-确定 分析-描述统计-频率 显示频率表-组段-确定 想要波浪号的话用变量的值标签改
注意:交叉表统计里的卡方属于独立性检验,只用于独立样本和关联性分析
凡是独立样本设计,录入时要加一个分组(指示)变量