导图社区 社会调查第五章
社会调查第五章抽样思维导图,抽样:按照一定规则从抽样框中抽取一部分单位作为样本的方法和过程。样本:按照一定规则从抽样框中抽取出来进行调查的单位。
编辑于2023-09-06 17:13:21 湖北省这是一篇关于地方政府与政治的思维导图,主要内容包括:绪论,中国地方政府概述,地方人民政府权力,地方人民政府职能,地方人民政府运行,地方各级人民政府,民族自治地方的人民政府,特别行政区政府,地方人民政府之间的关系,地方人民政府的政治关系,地方人民政府与地方财政。
这是一篇关于管理学的思维导图,主要内容包括:总论,决策,组织,创新,控制,领导。帮你理清思路的同时标注重难点,让你事半功倍,学习更高效!
这是一篇关于西方政治思想史的思维导图,主要内容包括:古希腊时期,希腊化与古罗马时期,中世纪的神学政治观,文艺复兴时期,17世纪英国,18世纪法国,18世纪美国,18世纪末19世纪初德国。
社区模板帮助中心,点此进入>>
这是一篇关于地方政府与政治的思维导图,主要内容包括:绪论,中国地方政府概述,地方人民政府权力,地方人民政府职能,地方人民政府运行,地方各级人民政府,民族自治地方的人民政府,特别行政区政府,地方人民政府之间的关系,地方人民政府的政治关系,地方人民政府与地方财政。
这是一篇关于管理学的思维导图,主要内容包括:总论,决策,组织,创新,控制,领导。帮你理清思路的同时标注重难点,让你事半功倍,学习更高效!
这是一篇关于西方政治思想史的思维导图,主要内容包括:古希腊时期,希腊化与古罗马时期,中世纪的神学政治观,文艺复兴时期,17世纪英国,18世纪法国,18世纪美国,18世纪末19世纪初德国。
第五章 抽样
第一节 抽样概述
抽样的相关概念
调查对象和调查总体
调查对象:调查过程中获取社会信息的最基层单位
调查总体:全部调查对象的集合体
研究总体
可操作的总体
可及的总体
可用于研究的总体
抽样单位和抽样框
抽样单位:抽样过程中使用的单位
可以是调查对象(个人、单位、乡镇、住宅、刑事犯罪案件等)
也可以是调查对象的某种集合体
抽样框:从研究总体中获得的全部抽样单位的集合体,即进入抽样过程的全部单位的名单或编号
从覆盖范围和覆盖数量出发:总体》研究总体》抽样框
抽样和样本
抽样:按照一定规则从抽样框中抽取一部分单位作为样本的方法和过程。
抽样有多种多样的方法,每种方法都有一定的程序和规则。
样本:按照一定规则从抽样框中抽取出来进行调查的单位。
参数值和统计值
参数值
又称总体值,是关于调查总体中某一变量的综合描述,或者说是调查总体中全部单位的某种属性或特征的综合数量表现。
统计值
又称样本值,是关于样本中某一变量的综合描述,或者说是样本中全部单位的某种属性或特征的综合数量表现。
抽样的逻辑
抽样的理想
观察:地区之间高度的异质性,地区内部高度同质性
理论:每一类地区的任意2所中学之间,其所处经济发展水平相同
同质性条件下的变异性
同质性:指一定测量精度下的一致性(例子:一些地、市之间的经济发展水平比较相近)
变异性:指同一变量属性值在不同个体之间的差异性(例子:每个地、市的经济发展水平都不相同)
样本与总体(误差)
如果总体内部完全是同质的,则任何样本与总体之间,都没有区别,如此条件下的样本,就是匀值样本
而在随机条件下,尽管每个抽样单位被抽中的概率是相等的,由样本代表的总体研究特征与总体的研究特征之间总是有差距。
误差:样本研究特征与总体研究特征之间的差异
抽样的类型
随机抽样
又称概率抽样,是指以概率论为基础,按随机原则抽取样本的方法。
非随机抽样
又称非概率抽样,是指不按随机原则而根据调查者的主观意愿、判断或是否方便等因素来抽取调查对象的抽样方法。
抽样调查的程序
设计抽样方案
针对调查总体、抽样方法、抽样误差、样本规模等有关问题设计出具体的操作方案。
界定调查总体
给调查总体的内涵和外延设计出明确的定义
编制抽样框
搜集、编制进入抽样过程的全部单位的名单或编号。
选择抽样方法
根据每一种抽样方法的优点和运用条件,结合调查对象的特点和要求,选择合适的抽样方法。
抽取调查样本
按照设计的抽样方法从抽样框中抽取调查样本。
评估样本质量
对样本主要特征的分布情况与调查总体主要特征的分布情况进行对比和评估。
第二节 非随机抽样及其常用方法
偶遇抽样(方便抽样)
调查者按照对自己来说方便的方式抽取样本。
判断抽样(立意抽样)
调查者根据自己的主观判断和调查目的来抽选样本。
配额抽样(定额抽样)
1.根据调查总体各组成部分所包含调查对象的比例分配样本数额
2.调查总体各组成部分内根据样本配额的数量,采用偶遇抽样或判断抽样等非随机方法抽取样本。
滚雪球抽样
先就近寻找个别调查对象进行调查,然后通过他(她)去寻找新的调查对象,像滚雪球一样寻找到越来越多的调查对象,直至达到调查目的为止。
志愿者抽样
从志愿者中抽取调查样本。例如,心理、医疗实验调查往往从招募的志愿者中抽取样本作为调查对象。
第三节 随机抽样及其常用方法
样本框中每一个抽样单位都有同等的被抽取成为样本的概率、机会、可能性
抽样步骤
界定抽样框
对要素编码
使用随机数表或软件抽样
随机抽样的常用方法
简单随机抽样
SPS抽样:指从总体N个单位中任意抽取n个单位作为样本
直接抽样法
抽签或抓阄法
随机数表法
在用自然数0~9组成的随机数表中随机抽取
计算机抽样法
运用统计软件产生的随机数抽取
等距随机抽样(系统抽样)
1.编制出抽样框。
2.用抽样框内单位总数除以样本数,求出抽样间隔距离。(如果小数,取整,四舍五入)
3.在第一个抽样间隔内随机抽取一个号码作为第一个样本。
4.在抽样框内,按照抽样间隔距离等距离抽取调查样本,直到抽取到最后一个样本为止。
分类随机抽样
1.编制出抽样框。
2.根据各类型或层次包含的抽样单位的数量与抽样框内抽样单位总数的比值,确定各类型或层次抽取样本单位的数量。
3.按照简单随机抽样或等距随机抽样方法从各类型或层次中抽取调查样本。
整群随机抽样
1.将抽样框内的抽样单位按一定标准分成许多群体,并把每个群体看作一个大的抽样单位。
2.按照随机从这些群体中抽出若干群体作为样本群体。
3.对样本群体中的每个抽样单位逐个进行调查。
多阶段随机抽样
适应条件:搜集数据的范围非常大,且直接抽取样本非常困难。
多个阶段的每个阶段,采用的抽样方法不一定
初级抽样单位(primary sampling unit, psu):多阶段抽样的第一阶段抽样单位
一般要求:抽样对象数量,是这一阶段设计样本量的3倍以上,否则降低抽样对象的层级
次级抽样单位(secondary sampling unit, ssu)
抽多少SSU合适?
异质性程度:如果次级抽样范围的异质性大,SSU就多。
费用:越接近末端抽样,越需考虑调查实施,SSU的数量反而不宜过多
末端抽样(ultimate sampling unit, usu):指抽取研究对象的抽样阶段
通常采用简单易行的抽样方法。与数据搜集或研究活动密切管理在一起。
步骤
1.确定抽样单位
2.抽取各级样本
3.对最后抽出的样本单位逐个进行调查
PPS抽样
概念
PPS抽样,就是让每个抽样单位被抽中的概率与抽样单位的规模成比例。因此,PPS抽样是等概率原则在一个抽样的应用
条件
具有抽样单位规模大小的辅助变量,即规模量度
规模量度:代表规模的变量
例如:如果按照与抽样单位的家庭户数量规模成比例的抽样,则记载各抽样单位家庭户数量的变量,就是规模量度
一般应用在两阶段或多阶段抽样中。每一阶段的规模量度应该相等
分层抽样
异质性的影响
如果总体要素之间具有较大的异质性,研究变量的变异性在要素中不是随机分布的,且要素规模不是估计误差的来源
用分层减少异质性的影响
步骤
1.分层:将研究总体按照研究特征变量(或常见变量如年龄、性别、受教育程度等)分层
2.抽样:在每个层,采用合适的抽样方式(如简单随机、等距、整群、等比例、不等比例、甚至PPS等)进行抽样
3.样本:将每个层的样本合起来加总,就是所需要的样本
条件
对研究总体在研究变量上同质性程度的了解
对研究变量的了解:通常,对研究变量的了解越充分,采用合适的分层,就月有利于降低抽样误差
分层变量:与研究目标有关;分层变量越多,层数也越多
情景
分层抽样,常常不会独立使用,分层是构造“子抽样框”的方法,而不是末端抽样方法。
分类抽样单位,指平行的,异质性子总体。
分层,依据研究问题涉及的主要变量等比例与不等比例抽样
在各层分配样本量时,如果依据与要素规模的比例,就是等比例抽样
随机抽样中应该注意的几个问题
抽样框编制问题
在实际调查中,人们往往忽视编制抽样框的重要性、复杂性和艰巨性,随意拿一些原有表册——如居委会户口册、村委会花名册、单位工资表等作为抽样框,这是不妥当的。
抽样概率问题
对于调查对象来说,群体或类的规模越小,被抽中的概率越高,群体或类的规模越大,被抽中的概率越低,这就违背了随机抽样的同等可能性原则。
入户后选择调查者问题
调查员入户后发现样本户中有不止一个符合作为调查对象条件的家庭成员,应该怎样选择调查对象?
在实际调查中,人们往往习惯于选择当家人或了解情况的人作为调查对象。
弊端是,在主观指标调查方面往往忽视了不当家的妇女、青年、老人的意见、看法、态度、感受、期望和建议。
第四节 抽样误差和样本规模
误差类型
非抽样误差
调查过程中人为操作失误造成的误差
抽样误差
样本统计值与总体参数值之间的差异
抽样方法
调查总体分布状况
样本规模
覆盖性误差
样本对总体覆盖过度、覆盖不足、都会导致误差
选择性误差
设计与执行中,可能导致某个特定类型的样本分布出现规律性的差异,如某一类人群过少或过多或缺失
解决方案
接受误差
可接受误差的大小——对精度的要求(人、财、物、时间、技术)
减少误差
寻找代表性样本
误差的基本统计量
偏差
是指按照某一抽样方案反复进行抽样,其估计值的数学期望与待估参数之间的离差
均方误差
指所有可能的估计值与待估参数之间离差平方的均值
样本均值、样本方差、样本标准差、总体均值、总体方差
抽样分布
抽样分布,又称统计量分布,指样本估计值的分布。
如果按照给定样本容量,用一种抽样方式反复抽取样本,每一套样本可以计算一个估计值由于样本是随机抽取的,估计值是一个随机变量,也遵从某个分布
总体分布
又称总体特征值分布,总体中,研究变量特征值的分布。
例如:某个班级的年龄分布年龄就是研究变量
样本分布
又称样本特征值分布,假定从总体中抽取了一定数量的样本,其研究变量的特征值会形成一个分布。
例如:从规模100人的班级中抽取了10名同学作为样本,10个同学的年龄也有一个分布
拟合度越高,则针对研究变量的抽样误差就越小,反之越大
样本规模
又称样本容量,是指样本中所含调查对象的多少。在抽样调查设计中,确定样本规模要综合考虑多方面因素。
第五节 抽样方案
抽样方案
是研究设计的一部分,将研究设计中用抽样方法搜集数据的部分进行操作化的产出
对于综合性研究而已,抽样方案就是数据搜集的设计部分只要涉及抽样,就要有抽样方案
无论抽样方法繁简,都要对抽样要素、方法、实施做出具体的说明
在涉及抽样的研究计划中,抽样方案是必须的部分
抽样方法的选择
取决于三个基本因素的状态:同质性、总体规模变量多少
经验:总体规模大+异质性强+变量多→多阶段、分层PPS抽样
总体规模大+异质性强+变量少→多阶段抽样(整群、配额)
总体规模大+同质性强+变量多→就近、判断,亦可以采取概率抽样方法
总体规模小+异质性强+变量多→滚雪球、知情人
抽样方案包括
总体:总体,研究总体,框总体
研究对象:最终的数据手记对象
样本量:末端抽样单位的数量
抽样方法:在复杂设计汇总,可以用多阶段混合抽样
注
如果是多阶段抽样,则每一阶段的抽样框、抽样单位、抽样方法、样本量配置、末端抽样方法以及每阶段权重
如果没有可用的抽样框,则还需说明抽样框的制作方法抽样实施方案,甚至包括各种估计量的计算方案
为什么要抽样?
资源
同质性
对象不可及