导图社区 现代社会调查方法4抽样
第四章 抽样 参考教材:现代社会调查方法(第六版)风笑天,总结了抽样的概念与程序、概率抽样的方法、非概率抽样方法、样本规模与抽样误差等。
编辑于2024-01-16 18:02:26抽样
一、抽样的概念与程序
(一)抽样的概念
1.总体(Population)
总体是构成它的所有元素的集合,元素则是构成总体的最基本单位
2.样本(Sample)
样本就是从总体中按一定方式抽取出的一部分元素的集合
3.抽样(Sampling)
抽样指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程
4.抽样单位(Sampling Unit)
抽样单位就是一次直接的抽样所使用的基本单位
5.抽样框(Sampling Frame)
抽样框又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单
6.参数值(Parameter)(总体值)
是关于总体中某一变量的综合描述 or 总体中所有元素的某种特征的综合数量表现
7.统计值(Statistic)(样本值)
它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量的表现
8.置信水平(Confidence Level)(置信度)
是总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间中的把握性程度
反映的是抽样的可靠性程度
9.置信区间(Confidence Interval)
是指在一定的置信度下,样本统计值与总体参数值之间的误差范围
置信区间反映的是抽样的精确性程度
(二)抽样的类型
抽样方法
概率抽样
简单随机抽样
系统抽样
分层抽样
整群抽样
多段抽样
非概率抽样
偶遇抽样
判断抽样
定额抽样
雪球抽样
(三)概率抽样的程序
1.界定总体
2.制定抽样框
3.决定抽样方案
4.实际抽取样本
5.评估样本质量
二、概率抽样的方法
(一)简单随机抽样(Simple Random Sampling)(纯随机抽样)
1. 定义
是概率抽样的最基本形式,是按等概率原则直接从含有N个元素的总体中抽取n个元素组成样本(N > n)
2.方法
(1)抽签法
(2)随机数表(乱数表)
定义
表中的数码和排列都是随机形成的,没有任何一点规律性
具体步骤:
① 先取得一份调查总体所有元素的名单(即抽样框)
② 将总体中所有元素一一按顺序编号
③ 根据总体规模是几位数来确定从随机数表中选几位数码;
④ 以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍
⑤根据样本规模的要求选择出足够的数码个数
⑥ 依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素
(二)系统抽样(Systematic Sampling)( 等距抽样、间隔抽样)
1.含义:
是把总体的元素进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取元素来组成样本的方法。
2.步骤:
①给总体中的每一个个体按顺序编上号码
②计算出抽样间距,方法是用总体的规模除以样本的规模 K(抽样间隔)=N(总体规模)/ n(样本规模)
③ 在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称作随机的起点
④ 在抽样框中,自A开始,每隔K个个体抽取一个个体。即所抽取个体的编号分别为A,A+K, A+ 2K, …… A + ( n -1)K ;
⑤ 将这n个个体合起来,就构成了该总体的一个样本
3. 注意
系统抽样的前提条件,是总体中元素的排列,相对于研究变量来说,应是随机的,不存在某种与研究变量相关的规则分布,否则,系统抽样的结果会产生很大误差
2种情况
(1)在总体名单中,元素的排列具有某种次序上的先后、等级上的高低的情况;
(2)在总体名单中,元素的排列上有与抽样间隔相对应的周期性分布情况。
(三)分层抽样(Stratified Sampling)(类型抽样)
1. 定义
它是先将总体中的所有单位按某种特征或标志划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本
2. 优点
①在不增加样本规模的前提下降低抽样误差,提高抽样的精度
②非常便于了解总体内不同层次的情况,便于对总体中不同的层次或类别进行单独研究,或者进行比较
3. 注意
分层的标准问题
① 以调查所要分析和研究的主要变量或相关的变量作为分层的标准
② 以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量
③ 以那些已有明显层次区分的变量作为分层变量
分层的比例问题 按比例抽样与不按比例抽样(区分两者的适用性)
(四)整群抽样
1. 定义
从总体中随机抽取一些小的群体,然后由所抽出的若干小群体的所有元素构成调查的样本的方法
2. 特点
①优点
简化抽样过程,降低费用, 可扩大抽样的应用范围
②缺点
样本分布面不广,代表性较差,尤其当子群间异质性较强时,影响代表性更明显
整群抽样与分层抽样的适用性
分层抽样
不同子群相互之间差别很大、而每个子群内部的差异不大时
整群抽样
当不同子群相互之间差别不大、而每个子群内部的异质性程度比较大时,则特别适用于采用整群抽样的方法
思考
假设我们调查的总体是全国所有城市的集合,我们要抽取一个规模为100个城市的样本,可以采用哪些办法来完成? (简单随机抽样,系统抽样,分层抽样,整群抽样……)
(五)多段抽样(多级抽样)
1. 定义
按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行 e.g.大学——学院——专业——班级——学生
2. 特点
①优点
不需要总体全部名单,抽样较容易;节约人力物力
②缺点
每级抽样都会有误差,故误差较大
注意:类别与个体之间要保持平衡
(六)PPS抽样
即概率与元素的规模大小成比例的抽样,其原理可以通俗地理解成以阶段性的不等概率换取最终的、总体的等概率
(七)户内抽样
1.“Kish选择法”
2.生日选择法
三、非概率抽样方法
(一)偶遇抽样(Accidental or Convenience Sampling)(方便抽样或自然抽样)
定义
是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象
例如
公共场所门口;利用报刊杂志;老师以他教的班级的学生作为调查样本进行调查
(二)判断抽样(Judgmental or Purposive Sampling)(立意抽样、主观抽样)
定义
是调查者根据研究的目标和自己主观的分析来选择和确定调查对象的方法
e.g.大学生择业倾向、就业意愿调查
(三)定额抽样(Quota Sampling )(配额抽样)
定义
研究者要尽可能地依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例,采用偶遇抽样或判断抽样的方法去选择调查对象,使样本中的成员在上述各种因素、各种特征方面的构成和在样本的比例尽可能接近总体情形。
e.g.从性别、年级和专业维度进行配额
与分层抽样的区别
(1)目的不同
定额抽样要保证样本与总体在结构比例表面上一致
分层抽样则包括比例分层和非比例分层
(2)方法不同
定额抽样中各层样本是非随机抽取的
分层抽样中各层样本是随机抽取的
(四)雪球抽样
当我们无法了解总体情况时,可以从总体中少数成员人手,对他们进行调查,向他们询问还知道哪些符合条件的人,再去找那些人并再询问他们知道的人。如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员
e.g.对退休老人生活的调查
四、样本规模与抽样误差
1.样本规模(Sample Size)(样本容量)
定义
是样本中所含个案的多少。根据一些社会调查专家的看法,社会调查中的样本规模至少不能少于100个个案
影响样本规模确定的因素
(1)总体的规模
(2)推断的把握性与精确性要求
(3)总体的异质性程度
(4)调查者所拥有的经费、人力和时间
2. 抽样误差(Sampling Error)
是用样本统计值去估计总体参数值时所出现的误差。它是由于抽样本身的随机性所引起的误差
抽样误差主要取决于总体的分布方差和抽样规模