导图社区 社会研究方法2.0
偶遇抽样:又称方便抽样或自然抽样,是非概率抽样方法的一种,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。
编辑于2022-11-22 19:09:38 安徽社会研究方法2.0
抽样
抽样的相关概念
总体
构成他的所有元素的集合
元素
构成总体的最基本单位
样本
从总体中按一定方式抽出的一部分元素的集合
抽样
从总体中取出部分个体的过程
抽样单位
直接抽样时所使用的基本单位
抽样单位与总体中的元素有时候是相同的,有时又是不同的
抽样框
一次之间抽样时总体中所有抽样单位的名单
重要性
抽样框是概率抽样一个最基本的要求,它的质量关系着抽样的质量。在实际抽样时,得到一个好的抽样框往往既困难又麻烦,需要具备一定的技巧和认真的态度
当总体范围太大时,如果没有现成的抽样框,就需要编制一个新的抽样框
有时可能会有一个现成的抽样框,但它们已经过时
在复杂的多段抽样中,相应各个阶段要有多个抽样框
参数值
又称总体值,是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现
在统计中最常见的是某一变量的平均值,例如某市待业青年的平均年龄、某厂工人的平均收入等
统计值
又称样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现
它是从样本的所有元素中计算出来的,是相应的总体值的估计量
抽样的目的之一 就是通过样本值去估计和推断各种总体值
抽样的作用
向人们提供一种实现由部分认识总体这一目标的途径和手段
在社会研究中,抽样主要解决的是对象的选取问题
抽样的类型
概率抽样
依据概率论的基本原理,按随机原则进行的抽样
随机抽取
即保证总体中的每一个个体都有同等计会入选样本,或者说总体中的每一个成员被抽中的概率相等,并且任何一个个体的入选与否与其他个体毫不相干互不影响,或者说每一个个体的抽取都是相互独立的,是一种随机事件。是抽样过程的关键。
类型
简单随机抽样
又称纯随机抽样,是概率抽样的最基本形式,是按照等概率原则直接从含有N个元素的总体中随机抽出n个元素组成样本(N>n)
系统抽样
又称等距抽样或间隔抽样,是指把总体的单位进行编号排序后,再计算出某种固定的间隔,然后按这一固定的间隔抽取个体号码来组成样本的方法
十分重要的条件是:总体中个体的排列,相对于研究的变量来说,应该是随机的
注意两种情况
总体名单中,个体的排列有某种次序上的先后、等级上的高低
总体名单中,个体的排列有与抽样间隔相对应的周期性分布的情况
分层抽样
又称类型抽样,是指将调查总体按某一标志分成若干互不交叉重叠的类组,其中每一类组称为一层,然后在各层内随机抽取调查单位组成层样本,将这些层样本汇总起来构成总样本即分层样本的随机抽样方式
优点
在不增加样本规模的情况下降低抽样误差
便于了解总体内不同层次的情况
整群抽样从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查样本的方法
优点
简便易行,节省费用
扩大抽样的应用范围
缺点
样本的分布面不广
样本代表性差
多段抽样
又称多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行
适用于总体范围特别大,对象层次特点多的社会研究。
缺点
误差较大,每一级抽样都会产生误差
减少误差的方法
相对增加开头阶段样本数,适当减少最后阶段样本数
非概率抽样
主要依据研究者的主观意愿、判断是否方便等因素来抽取对象
类型
偶遇抽样
又称方便抽样或自然抽样,是非概率抽样方法的一种,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象
表面上看与随机抽样有点相似,都排除了主观因素影响,但是二者有一个根本差别,就是偶遇抽样没有保证总体中的每一个成员都有同等的被抽中的概率
判断抽样
又称立意抽样或目的抽样,它是研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法
优点
可以充分发挥研究人员的主观能动性
缺点
样本的代表性难以判断
定额抽样
又称配额抽样,是指按某个标准或变量将被调查总体的单元分类,然后根据总体内各类单元的比例规定样本数目,再分配给每个调查采访人员一定定额的方法
与分层抽样的相同点
都根据某些特征对总体进行分层
区别
分层抽样完全依据概率原则,排除主观因素,客观地等概率地在各层中抽样;定额抽样则不是按等概率原则进行抽样
抽样的一般程序
界定总体
在具体抽样前,首先对抽样样本的总体范围与界限做明确的界定
制定抽样框
这一步骤的任务就是依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立抽样框
决定抽样方案
各种不同的抽样方法有不同的特点和适用范围,根据研究目的的要求、各种方法的特点以及其他有关因素来决定使用哪种抽样方法
实际抽取样本
在上述几个步骤的基础上,严格按照所选择的抽样方法,从抽样框中抽取一个个抽样单位组成样本
评估样本质量
完整的抽样工作还应包括样本抽出后对样本进行的评估工作
抽样设计的原则
目的性
抽样方案的设计要以课题研究的总方案和研究的目标为基础,以研究的问题为出发点,从最有利于研究资料的收集以及最符合研究目的等因素来考虑抽样方案和抽样方法的设计
可测性
抽样方案的设计能够从样本自身计算出有效的估计值
可行性
研究者所设计的抽样方案必须在实践中切实可行。它意味着研究者所设计的抽样方案能够预料实际抽样过程中可能出现的各种问题,并设计了处理这些问题的方法
经济性
抽样方案的设计要与研究可得资源相适应
这四条标准中,目的性和可行性原则是首要的。研究者应该在优先考虑这两条标准的基础上,去进一步提高方案的可测性,同时减少所用资源
户内抽样
从所抽中的每户家庭中抽取一个成年人,以构成访谈对象的抽样过程
方法
Kish选择法
先将调查表分为A、B1、B2、C、D、E1、E2、F八种,分别占总数的...
同时印制若干套选择表发给调查员
对每户家庭中的成年人进行排序和编号。男前女后,年龄大前年龄小后
根据调查表上的编号找出相应的选择表,查出该选个体的序号,进行访谈
优点
每户家庭中的成年人都有同等机会被选中
不仅可以收集到样本家庭资料,还可以收集到这些被访者个人样本的资料
生日法
随机确定一年中的某一天为标准日期,为便于计算,通常选某个月的第一天
了解所抽中的户中成年人口数以及每个人的生日
计算出每人生日距离标准日期的天数
选出距离最近的人作为调查对象
PPS抽样
将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样
优点
使用了辅助信息,减少了误差
缺点
对辅助信息要求高,方差的估计复杂
样本规模
又称样本容量,是指样本中所含元素的多少
影响样本规模确定的因素
总体的规模
当总体规模较小时,提高样本占总体的比例,能够明显改善抽样的精确度,但当总体达到一定程度时,样本规模的改变量是很小的
推断的把握性和精确性
用置信度和置信区间两个概念来说明样本规模与抽样的可靠性与精确性
置信度又称置信水平,是指总体参数值落在样本统计值某一区间的概率,或者说总体参数值处在样本统计值某一区间的把握性程度。它反映的是抽样的可靠性程度
置信区间。区间估计是以数值的区间形式来确定总体参数的可能范围,它是依据概率抽样原理,以一定的概率(可信度)来保证总体指标落在某一区间中,这个区间称为置信区间,置信区间的大小和可信度的高低成正比
总体的异质性程度
为了达到同样的精确度,在同质程度高的总体中抽样时,所需样本规模较小;在异质程度高的总体中抽样时,样本规模较大
研究者所拥有的经费、人力、时间
从样本的代表性、抽样的精确性考虑,样本规模越大越好,但受到研究者所拥有的经费、人力、时间等方面限制,样本规模又是越小越好
此外,还有一些因素也会有一定影响,例如分析要求与样本容量;抽样方法和样本容量;无回答和样本容量
总结,样本规模的确定需要综合考虑各方面因素,没有一成不变的规定
抽样误差
样本统计值与总体参数值之间存在的偏差,它是由于抽样本身的随机性所引起的误差
抽样误差主要取决于
总体的分布方差
降低总体的分布方差,从而降低样本统计量的随机波动程度,就会提高样本统计量估计总体参数的精确度
抽样规模
随着抽样规模的增加,样本统计量的波动范围也会逐渐降低,抽样误差也会随之降低
抽样规模与抽样误差的关系问题,注意两点
对于比较小的样本来说,样本规模上很小的一点增加,便会带来精确度方面很明显的提高
而对于比较大的样本来说,同样增加这么多个个案,却收效甚微