导图社区 社会调查第十三章
社会调查第十三章统计分析思维导图,统计分析就是运用统计学原理和方法处理通过调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。
编辑于2023-09-06 17:19:36 湖北省社会调查第十三章统计分析思维导图,统计分析就是运用统计学原理和方法处理通过调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。
社会调查第十一章网络调查法思维导图,网络调查,又称为网上调查、在线调查,是指通过互联网及其调查系统把传统的调查、分析方法在线化、智能化,简言之就是借助互联网进行的问卷调查。其构成包括三个部分:用户、调查系统、参与人群。
社会调查第十章实验调查法思维导图,实验者按照一定的实验假设,通过改变某些自然、社会条件或环境的实践活动,来检验某种理论假设,认识实验对象的特性、内在本质及发展规律的调查方法。
社区模板帮助中心,点此进入>>
社会调查第十三章统计分析思维导图,统计分析就是运用统计学原理和方法处理通过调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。
社会调查第十一章网络调查法思维导图,网络调查,又称为网上调查、在线调查,是指通过互联网及其调查系统把传统的调查、分析方法在线化、智能化,简言之就是借助互联网进行的问卷调查。其构成包括三个部分:用户、调查系统、参与人群。
社会调查第十章实验调查法思维导图,实验者按照一定的实验假设,通过改变某些自然、社会条件或环境的实践活动,来检验某种理论假设,认识实验对象的特性、内在本质及发展规律的调查方法。
第十三章 统计分析
统计分析概述
统计分析的概念
统计分析就是运用统计学原理和方法处理通过调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。
统计分析的目的
简化和描述数据。
在社会调查中,搜集的数据多种多样,数量庞大。在撰写调查报告时,没有必要也没有可能罗列每个数据,而是运用统计分析方法将调查数据简化后再描述出来。
用样本推断总体。
在随机抽样调查中,对样本的调查只是手段而不是目的,真正的目的在于通过对样本进行分析所获得的统计量,来推断总体参数。
样本统计量
总体参数
发现变量之间的统计关系。
统计分析的过程
在数据录入和清理之后,数据的统计分析,大致要经过两个过程:
数据预处理
就是在统计分析之前对清理后的数据做预备性处理。预处理,一般包括缺损值处理、加权处理、变量重新编码、数据重新排序,以及创造新变量等。
数据统计分析
就是调用统计软件中的各种统计程序对数据进行分析,包括单变量、双变量、多变量统计分析,以及制作统计图、统计表等一系列工作。
统计分析的层次
按照统计分析的性质
描述统计
描述统计是运用数字(如频数、百分比、平均值)和图、表等形式汇总所收集来的数据信息。
目的:在不歪曲或丢失大量信息的情况下,将数据信息简化为更易理解的形式
推断统计
是运用概率分布知识,通过样本统计量预测总体参数的分析方法。
目的:通过对样本的调查来了解总体。
当数据描述结果仅适用于一个样本,而我们希望了解总体的特征时,可以使用推断统计。
按照统计分析涉及变量的多少
单变量统计分析
只涉及一个变量,它用平均数、百分比等来描述单个变量的特征,也可以进行区间估计、显著性检验等推断统计分析。只能进行描述性研究。
双变量统计分析方法
包括列联表分析与χ2检验、秩相关检验、单因素方差分析、简单线性回归分析等。
当一项统计分析涉及三个或三个以上变量(其中至少有一个因变量)时,则被称为多变量或多元统计分析。
双因素方差分析、多元线性回归分析、因子分析、Logistic回归分析等。
如果要进行解释性研究,就必须进行双变量统计分析或多变量统计分析。
推断统计的基本原理
推断统计的必备前提是,样本数据必须来自随机抽样调查。只有用随机方法抽取的样本,其样本统计量才具备推断总体的资格。
推断统计与抽样分布
样本的抽样分布的目的就是运用它来由样本统计量推断总体参数值。因此,抽样分布是推断统计的依据或工具。
抽样分布,是指在一个总体中重复抽取许多大小一样的样本的统计量而形成的分布。
抽样分布的一个重要作用在于预测统计量的落点及其与所估计参数的接近程度。抽样分布的建立与作用并非只是人们的一种设想,它有其实际的数理基础或理论依据,这就是中心极限定理。
参数估计
把通过样本计算出来的统计值称为样本统计量,简称统计量,而把总体统计值称为参数。
参数估计就是运用样本统计量对总体参数进行推断或估计的统计过程与统计方法。参数估计包括
点值估计
点值估计是选择一个适当的样本统计量直接代表总体的参数值。
优点
无偏性、一致性、有效性
缺点
无法知道估计的误差到底有多大
区间估计
区间估计是用一个数值区间表示未知总体参数落入该区间的概率或可能性有多大的一种统计方法。
置信区间是指在进行区间估计时,在某一概率水平下总体参数所处的数值区间
理论基础
抽样分布
核心问题
把样本统计量与总体参数之间的关系转换成抽样分布来处理。
分布具有的特性是
总体平均数或抽样分布平均数处于样本平均数±1.96个抽样分布标准差范围内的概率为95%,处于样本平均数±2.58个抽样分布标准差范围内的概率为99%。
假设检验
假设检验是以抽样分布原理为基础,检验调查样本中的统计特性是否在总体中同样存在的一种统计方法。它是推断统计中最重要也是最常用的方法。
参数估计是用具体的样本统计量(如平均数、标准差、百分比等)来推断总体参数,而假设检验则是检验样本中的事实、关系在总体中是否也存在。
属于推断统计范畴,随机抽样是其前提或必备条件。进行假设检验,必须首先建立两个假设
虚无假设
假设在样本中观察到的事实或变量之间的关系在总体中并不存在,样本中出现这种情形是由抽样误差造成的。
备择假设
与虚无假设相反的假设,就是假设在样本中出现的情况并不是抽样误差,在总体中也同样存在。
假设检验的过程,是以检验虚无假设H0中心展开的,检验的结果无非两种情况
接受虚无假设H0
拒绝虚无假设H0,接受备择假设H1
单变量统计分析
集中量数分析
集中量数有平均数、中位数、众数、四分位数、百分位数,以及倒数平均数、几何平均数等
平均数(算术平均数)
中位数(中数、中点数)
众数(范数、密集数、通常数等)
离散量数分析
表示一组数据变异程度或分散程度的量数
离散量数越大,表示数据分布范围越广,越不集中,越不整齐;离散量数越小,则表示数据分布范围越集中,变动程度越小
离散量数有多种,如方差与标准差、全距、四分位差、异众比率、离散系数、偏度系数等
类型
方差与标准差
异众比率
离散系数
偏度系数
单变量推断统计
参数估计(主要是区间估计)是用样本统计量来估计总体参数,它通常只涉及一个变量,也有涉及两个变量的,如相关系数的区间估计等,只是较少用到。
在单变量分析中,可分为三种情况或类型:总体平均数的参数估计、总体比率的参数估计和总体方差的参数估计。
假设检验:在单变量分析范围内,分为三大基本类型,即总体平均数的假设检验、总体比率的假设检验、总体方差的假设检验。
每一类型又可分为两种小类型
单样本总体假设检验
对单个样本的统计量(如平均数、比率、方差)可否推断总体的检验
双样本差异的总体假设检验
对两样本统计量的差异(如平均数之差、比率之差、方差之差)是否在总体中也存在的检验,亦即要证明两样本的差异是否由来自两个不同的总体造成。
双变量统计分析
双变量统计分析的内容
两变量间的相关关系
当一个变量X发生变化时,另一个变量Y也随之发生变化,相反,当X发生变化时,Y也发生变化。
社会现象之间的相关关系,从不同角度可区分为不同类型
按照相关方向的不同
可分为正相关和负相关
按照相关强度的不同
可分为完全相关、不相关和不完全相关
按照相关形式的不同
可分为线性相关和非线性相关
两变量间的因果关系
一变量的变化可以确定为另一变量变化的原因的关系。
要确定两个变量之间的因果关系,必须同时满足三个条件
两变量间必须存在相关关系
先有原因,后有结果。
必须确定变量X与Y之间的关系,不是由于第三个变量的存在而呈现出的一种虚假关系。
双变量统计分析的方法
在双变量统计分析中,由于变量的测量层次不同,因而计算两变量相关系数的方法和假设检验的方法也不相同。
变量的测量层次,可分为定类、定序、定距、定比四种类型,这样就形成了多种不同测量层次变量的两两组合。
类型
定类-定类(或定序)变量分析
定序-定序变量分析
定类(或定序)-定距变量分析
定距-定距变量分析
两个定距变量的相关分析:两个定距变量的相关系数,通常使用皮尔逊积差相关(或积矩相关)公式计算
一元线性回归分析
对两个定距变量进行回归分析,被称为一元线性回归分析,即只有一个自变量X,且两变量间存在线性相关关系。
一元线性回归分析,实质上就是要在变量X和变量Y之间建立一个线性回归方程,从而用X去预测Y。
这个公式可以说是回归系数b的定义公式,为计算方便,可将其转化为能直接用原始数据计算b的公式:建立回归方程的主要问题是求出方程中回归系数b(回归线的斜率)和回归线在Y轴上的截距a,这一过程被称为配制回归线或拟合回归线。
确定回归系数b的原则是使散点图(根据X和Y一一对应的值绘制而成的分布图)上各点距回归线上的相应点的垂直距离平方和为最小,这种求回归系数b的方法被称为最小二乘方法。
多变量统计分析简介
多变量相关分析
是相对于双变量相关分析而言的。在双变量相关分析中,是用一个统计量(如相关系数λ、G、r等)反映两个变量间的相关关系。当变量达到三个或三个以上时,相关关系的分析就属于多变量相关分析或多元相关分析了。
与多变量相关分析直接有关的方法,有偏相关分析、复相关分析、典型相关分析
多元回归分析
是研究两个或两个以上自变量和一个因变量之间的关系,并用自变量解释与预测因变量的多变量统计分析方法
多元方差分析
是对多个定类变量(自变量)与多个定距变量(因变量)关系的多变量统计分析方法,其分析的统计原理与方法同一元方差分析相似,只是程序更加复杂
因子分析
是一种从众多相关变量中抽取若干个共同因子,从而使复杂数据得以简化的多变量统计分析方法。
被抽取的因子称为公共因子,因子分析的作用主要表现在两个方面
探索数据的基本结构和变量之间的关系
用公共因子简化数据,以便于做进一步分析
对数线性模型分析
是在自变量和因变量都是定类或定序变量时,用以分析它们之间的相互关系的多变量统计分析方法,它处理的是以交互分类表形式出现的定类或定序数据。
结构方程模型分析
是一种用于建立、估计、检验因果关系模型的功能强大的多变量统计分析方法。它把因子分析、回归分析、路径分析、方差分析等多种多变量统计分析方法有机地整合在一起。
多层线性模型分析
是专门用于对具有层次结构特性的数据进行多变量统计分析的统计方法
量数分析
用一个具体的统计量反映一组数据向该统计量集中的趋势的统计方法。它所表示的是一组数据集中的程度或水平。