导图社区 SPSS课程学习pro
SPSS课程学习思维导图;包含一、基础知识普及,(点)信息初步处理,1.1单选题的录入,1.2多选题的录入:针对多个选项,对每个选项都有是否判断(多重二分法)等等
编辑于2022-04-25 21:32:49SPSS课程学习
一、基础知识普及
(点)信息初步处理
1.1单选题的录入
1.2多选题的录入:针对多个选项,对每个选项都有是否判断(多重二分法)
1.3对于无效数据的处理(脏数据)
(1)重复值查找
(2)异常值查找
对于数据基本特征的认识
2.1描述性分析(量)
熟悉:平均数 众数 中位数 最大值、最小值
方差/S的平方/D(x):对于平均的偏离程度,越小越好。 标准偏差=方差开根号:也是对于数据稳定性描述,越小越好。 极差/范围/域值: max-min 偏离系数(g):看左右对称程度。 峰度系数/峰态系数(peakedness):大于0为高峰;小于0为低峰。
2.2交叉表分析(变量之间)
前提:进行卡方检验。 皮尔逊卡方的显著性<0.05=5%有价值,显著差异 制作交叉表分析:分为列与行(实质看的两个变量之间相关性,其产生数据的特点)
对于问卷整体质量的检测
3.信度分析 (对于问卷整体回答质量的检测,是否可能存在乱填,一人多份的现象检测)
标准: (1)克隆巴赫系数(Cronbach 's alpha):大于0.7很好;0.6—0.7可以;小于0.6从新考虑 (2)极差/范围/域值: max-min 范围要适中,不要过大 (3)删除部分问卷问题后信度变化(克隆巴赫系数)与相关性情况:信度变大,相关性小为好。
4.效度分析
内容效度(看问卷设置问题的质量高低,多有专家评分时用)
结构效度(把问卷内部问题因子,有相似性或者关联性的分为一组,组组比较,提升问卷质量)
(1)KMO数值大于0.7为好 (2)Bartlett 的球形度检验 小于0.05为好。 (3)单因素方差ANOVA的显著性越小越好。(组之间) (4)组之间的描述性数据的特征; : (5)事后多重比较:组之间平均差变化的显著性比较
子主题
问卷因素之间具体关系的探索
5.方差分析
各个因素对于实验结构的影响是否显著,分为单因素方差分析、双因素方差分析、多因素方差分析
6.相关性分析(相关关系)R
双变量相关性
判断标准: (1)皮尔逊相关系数 -属于-1和1之间,为正表示正相关;为负表示负相关, 相关系数绝对值越大说明相关性越强。 <0.3 相关性弱 >=0.5 相关性强 >=0.7相关性极强 (2)可以加上显著性分析
第一步:单因素方差ANOVA查看,其显著性高低 第二步:单因素描述性 第三步:组别之间的多重比较
7.回归性分析(函数关系)
(1)一元回归
含义:可能受多个因素影响,但其中有主要因素。 一元线性回归方程:y=a+bx+残差项,其中a和 b是常数。
第一步:建立图表/散点图:观察是否有一定集中趋势。 第二步:看其相关性①皮尔逊相关系数+②显著性 第三步:回归分析模型 ①拟合度:看R方 ②ANOVA回归的F值显著性好坏 ③得出常量a(B常量)、b(B常量下面)的显著性好坏 ④得出回归方程:y=a+bx(要写明x为什么,y为什么)
(2)多元回归
第一步:建立图表/散点图:观察是否有集中趋势。 第二步:建回归模型 第三步:查看各个回归模型的拟合系数R方的数值,对应显著性,选出最合适的模型。
二、以一个调差问卷为例展开分析
1.样本的基本背景信息统计
(1)针对调查对象的一些社会属性进行分类研究,明白我调查的是些什么 例如:性别、年龄、收入、职业 (2)通过其频率占比统计,明晰样本对象长什么样
2.样本的基本特征描述分析
(1)将样本对象对于本次调查的主题的一些回答进行归类分析 (2)明晰这些样本对于本次问卷主题的目的、类的看法分类
3.因子分析(问卷内部多个问题,将相关性大的问题分为一组,组组比较分析,降维处理)
第一步:(描述里)分析数据是否适合进行因子分析 标准:KMO和Bartlett/巴特利+显著性 第二步:(提取里)选择抽取因子的固定数量(因子分组数) 第三步:旋转矩阵使其数据更加集中,利用最大方差进行旋转
第四步:对成组的因子进行分类命名为不同的新的因子变量; 但是对于目标变量最好合并为一组,这样有利于后面多元回归因变量的设计 后面建立的函数,得到的值,其平均给各个目标变量越完美越好
4.信度分析
5.效度分析
6.研究变量描述性分析
7.相关性分析
8.多元线性回归(回归→线性)
线性
第一步:选定自变量、因变量 第二步:判断其模型拟合度+共线性
9.方差分析——单因素方差
三、图表制作
图
频率统计
簇状图
信度效度分析
四、交叉表分析+二元逻辑函数
交叉分析表
含义:交叉列表分析法是指将两个或两个以上有一定联系的变量及其变量值按照一定的顺序交叉排列在一张统计表内,使各变量值成为不同变量的结点,从中分析变量之间的关系,进而得出科学结论的一种数据分析技术。
单选题
多选题
第一步:构建多响应集 第二步:定制表
二元逻辑函数
构建函数,综合不同评价体系,为结果带来确定性
第一步:区分因变量和多个自变量 第二步:将多个自变量中无差别变量进行区分
五、探索性因子分析+聚类分析
探索因子分析
对于多个因子进行分组,让组内相似关联,组间差别大。 同时是对因子分析的深化,对于不适合分类的因子进行剔除
第一步:讲所有因子进行旋转分析 第二步:对旋转表进行分析,将于各个组关联性不大,或者均匀关联但区分度不大的提出 第三步:进行新的旋转 第四步:归纳总结形成新的组别
聚类分析
通过对已经有的数据进行分析,运用K-平均值聚类分析方法 分类总结不同个数据符合,各种组特征大小 对个数据进行分阶
前提:在探索因子分析的基础上构建新因子 其次:通过对于聚类组的分组尝试,找出合适的组别 (组别数由客观背景+样本特征等多个因素影响)
第三步:旋转结果为旋转后矩阵 观察矩阵中一个因素与那几个因素的相关性高,越高划分为一组,最完美的结果是,所有因素都能够完美的匹配分组,此时可以看到4组是最好的。
第二步:提取因子数量选择完后结果显示 解释的总方差 累积方差解释率(累积方差贡献率)表示提取出的多个因子能解释的信息量, 一般大于60%(表示分析数据的信息损失小于40%)说明因子分析结果较好,大于50%说明可以接受。
第一步:KMO范围0~1,越接近1表示越适合进行因子分析, 通常以KMO值大于0.6(有的资料是0.5或0.7)为判断标准。 如果KMO值小于0.6(或0.5或0.7),则不适合做进一步分析, 可以尝试优化问卷,例如删除一些不合适的题目,合并一些选项。
偏离系数