导图社区 风笑天社会科学研究方法导论篇4
社会科学研究方法导论篇第六章包含抽样术语,抽样类型,抽样分布和误差,抽样程序和原则。抽样设计原则有目的性,可行性,可测性,经济性,随机性。
编辑于2021-12-24 16:04:15社科导论篇4
第六章
抽样术语
1、抽样 2、抽样单位 3、抽样总体 4、抽样框/样本框 5、样本 6、参数值 7、统计值 8、置信水平:指总体参数值落在某一区间的概率,因为抽样对总体参数作估计时,由于样本的随机性,结论是不确定的,因此采用一种概率的陈述方法。 9、置信区间:在某一置信水平下,用样本统计值推论总体参数值的范围。 10、标准误差 11、样本偏差
抽样类型
随机抽样
MJL
定义:随机原则抽取样本,总体中每个单位有同等机会被抽取,因此能避免抽样过程中的人为误差,保证样本的代表性。就均值而言,当样本数量足够大时,抽样分布接近正态分布,样本统计值接近总体参数值,因此可以推断总体情况。 优点:能够很好地按照总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。
简单随机抽样
等概率原则直接随机抽取若干单位组成样本。适用总体较少,否则难以确定抽样框。方法:抽签法,随机数表法。 随机数表法:1)抽样框内单位排序编码。2)从随机数表任一起点抽取样本,根据总体规模是几位数来选几位数码,并以总体规模为标准取舍,重复抽样时可保留相同数字。3)抽取足够样本后,到抽样框中找出对应元素。
系统随机抽样/等距随机
1)总体单位排序编码。2)按照总体单位数除以样本单位数,计算出抽样间隔(K=N/n)。3)从1-k中随机抽取一个样本A。4)按照固定间隔随机抽取个体,以(A+(n-1)k)的号码组成样本。
优点: 1)简单易行,省去查随机数表法、编制号码标签等繁杂手续。 2)样本均匀地分布在总体中,具有较好的代表性,抽样误差比简单随机抽样小。 缺点: 1)虽然个体是随机排序,但这是一种准随机,在抽样间隔距离相邻的单位入选概率为0 2)个体排序如果存在某种次序先后、等级高低情况,样本表现的总体水平会偏高或偏低eg.成绩排序,收入排序 3)当个体排列上存在与抽样间隔相对应的周期性元素时,会出现系统性的误差,影响代表性和结论。eg.间隔和班级人数相同时,同时按照成绩排序
分层随机抽样
总体按照某种特征或标志分成若干层次,根据各类别单位数和总数的比例确定各层样本数量,在各类别中采取简单随机抽样或系统抽样。
优点: 1)使用与总体规模大,内部异质性强的调查对象,在分类时利用了已知的总体性质,克服了简单抽样和等距抽样的缺陷,抽样误差更小,或者需要更小的样本数量。 2)便于了解不同层次的情况,以及对各层级进行再研究 要求: 1)需要对总体有全面了解 2)分类标准要科学符合实质,互补交叉,无所遗漏 3)以研究主要变量为分层标准,做到同层同质,异层异质 4)按比例分层抽样时,层次内单位数目要充足;不按比例分层抽样时,要对各级数据加权分析
整群随机抽样
1)总体中各单位分成互不交叉重复的集合(子群)并进行编码,2)从总体中随机抽取部分群体,3)抽取的群体所有单位构成样本。
优点: 1)简单易行,节省费用,能够弥补抽样框的缺失 2)使用涉及广大地理区域的研究 3)适合子群间同质性强,子群内部异质性强的总体,或不能进行单个个案调查的总体 缺点: 1)样本不太均匀,很难人为缩小群组间差异 2)样本分布面不广,代表性和精确性地域简单抽样,常与其他方法结合
多段随机抽样
按抽样元素的隶属关系或层级关系,把抽样过程分成几个阶段进行,和其他抽样方法一起使用。适用于总体规模特别大,或分布范围广的调查。
优点:容易进行,节省,样本具有较强代表性 缺点:1)每段都有抽样误差,误差较大。2)人为设定了各段抽样单位是等概率被抽中的,但因为群体规模不一样却抽取了同样数量的个体,导致最终个体被非等概率抽取。
pps抽样
概率与规模成比例的抽样,以阶段性的不等概率换取最终的等概率。第一阶段,每个群按照其规模被给予大小不等的抽样概率;第二阶段,从每个子群中抽取相同数量的元素。
1)子群排序编号,标明其规模占总体规模的比例。2)按照比例分配号码范围,规模大的子群范围更广。3)第一阶段抽样:按照随机数表法或系统抽样方法,抽取号码,入选第一阶段样本。4)第二阶段抽样:各子群根据入选号码数量,随机抽取相应数量的样本。
非随机抽样
定义:依据研究者主观意愿、判断或方便来抽取对象,不考虑等概率原则。 优点:快速便捷,费用低,无需抽样框,适用探索性研究和调查设计开发 缺点:无法计算出可靠的估计值以及抽样误差估计值;存在选择性偏差,风险大,要求对样本的代表性作很强的假定;误差大,难以保证样本代表性。
偶遇抽样
=方便抽样,依据自己便利抽取偶然遇到的人作为对象,或仅选择容易找到的,适用于探索性研究,但样本代表性差,具有很大偶然性。
判断抽样=立意抽样
根据研究目标和主观分析选择研究对象。适用于总体范围较小,总体单位之间差异很大的调查。 优点:对总体熟悉,经验丰富。 缺点:样本代表性很难确定,完全取决于眼记者个人判断能力和对调查对象的了解程度。
定额抽样
1)现依据可能影响研究变量的因素对总体分层,并确定样本数量,按照一定的标准和比例分配样本。2)从符合标准的对象中任意抽取样本,是样本中的成员在上述因素、特征的构成以及比例都尽量接近总体。 优点:简单易行,不需要样本框,减少返工的需要,只要寻找符合条件的下一个受访者即可。 缺点:主观随意性和局限性,样本有效的前提是对总体各种比例有所了解
滚雪球抽样
=连环抽样,以少量样本为基础,逐渐扩大样本规模,直到找出足够数量的样本。适用于对总体不太清楚的探究性的实地研究中,尤其适用于小群体关系研究。 缺点:随意性和特殊性,某个已知的人被提及次数越多,越可能进入样本,但熟知≠典型。
抽样分布和误差
中心极限定理
对于抽自任意总体的样本量为n的随机样本,样本均值的抽样分布近似服从正态分布。当n足够大时,无论总体的分布如何,其抽样分布都趋于正态分布,样本统计值接近于总体参数值。
误差
非抽样误差和抽样误差
非抽样误差: 人为原因产生的偏差。理论上可以缩小甚至消除,但无法计算大小,因此扩大样本规模不一定会减少非抽样误差。 产生原因: 1)调查方案设计有缺陷,抽样方案违背了随机原则 2)工作误差,记录、整理、数据分析 3)被调查者理解和回答问题出现错误,或隐瞒真实情况
抽样误差: 统计值与参数值的平均差值。由抽样本身产生的误差,反映的是样本对总体的代表程度。 影响因素:总体构成状况和样本规模
随机性误差和系统性误差
随机性误差: 测定过程中一系列有关因素的随机波动而形成的具有相互抵偿性的误差,不可预测。
系统性误差: 如违反随机原则的偏向性误差,在抽样中由登记、记录造成的误差等。它使总体特征值在样本中过高或过低,具有规律性和可预测性。产生误差的因素在测量前就存在,且具有累加性。
选择性偏倚:在研究对象选取过程中,由于选取方式不当导致入选对象与未入选对象之间存在系统性差异。
允许误差:用一定置信度保证抽样误差不超过某一允许范围,即抽样指标与总体指标之间误差的最大可能范围。
影响样本规模因素
1)总体中个单位之间差异程度(标准差误δ),差异越大,n要求越大 2)允许误差(ΔX),越小要求样本规模越大 3)置信度(1-a),越高n越大→Ζ^2(1-a)或t^2 4)抽样方式 5)回应率 6)总体规模(总体小时关注,达到一定点后增加样本不会提供额外信息 7)精确度 8)调查实际操作:经费、时间、需要、能力、访员
注意事项: 1)不要为了追求最小误差选大样本 2)可以接受一个较大的误差界限,有效利用资源获得更高的精度 3)采用小样本节省的费用去修正影响精度的因素 4)减少无回应率(回访、试点、培训)
抽样程序和原则
抽样程序: 1)界定总体——良好抽样效果的前提 2)制定抽样框——抽样总体范围与单位 3)决定抽样方案。根据研究目的、抽样方法、样本规模、目标量的精确度 4)抽取样本 5)评估样本质量——质量、代表性、偏差评估
抽样设计原则: 1)目的性——出发点 2)可行性——前提 3)可测性 4)经济性 5)随机性 6)抽样效果最佳——费用固定时误差最小,精确度固定时费用最小