导图社区 经济基础第二十五章抽样调查
经济基础第二十五章抽样调查知识点总结,抽样调查是使用频率最高的一种调查方式。它是指按照某种原则和程序,从总体中抽取一部分单位,通过对这一部分单位进行调查得到信息,以达到对总体情况的了解,或者对总体的有关参数进行估计。
编辑于2024-07-08 09:13:08第一章企业战略与经营决策-企业战略类型知识点总结,包含基本竞争战略、企业成长战略、企业稳定战略、企业紧缩战略。
24版工商管理第一章企业战略和经营决策-企业战略分析,企业战略指企业在激烈的市场经济竞争环境中,在总结历史经验、调查现状、预测未来的基础上,为谋求自我生存和发展而做出的长远性、全局性的谋划。
如何提升直播间流量竞争力,详细概述了如何提升直播间流量竞争力的多方面策略。强调了提升直播间流量竞争力的全方位策略,包括优化直播场景、增强主播能力、精准选品与排品、利用数据指导决策以及加大流量投放等。通过这些策略的综合运用,可以有效提升直播间的流量承接力和转化率,从而实现销售额的增长。
社区模板帮助中心,点此进入>>
第一章企业战略与经营决策-企业战略类型知识点总结,包含基本竞争战略、企业成长战略、企业稳定战略、企业紧缩战略。
24版工商管理第一章企业战略和经营决策-企业战略分析,企业战略指企业在激烈的市场经济竞争环境中,在总结历史经验、调查现状、预测未来的基础上,为谋求自我生存和发展而做出的长远性、全局性的谋划。
如何提升直播间流量竞争力,详细概述了如何提升直播间流量竞争力的多方面策略。强调了提升直播间流量竞争力的全方位策略,包括优化直播场景、增强主播能力、精准选品与排品、利用数据指导决策以及加大流量投放等。通过这些策略的综合运用,可以有效提升直播间的流量承接力和转化率,从而实现销售额的增长。
经济基础第二十五章抽样调查
抽样调查基本概念
基本概念
抽样调查是使用频率最高的一种调查方式。它是指按照某种原则和程序,从总体中抽取一部分单位,通过对这一部分单位进行调查得到信息,以达到对总体情况的了解,或者对总体的有关参数进行估计
总体与样本
总体即调查对象的全体。例如,欲对北京市的个体商业进行抽样调查,则北京市所有的个体商业单位就构成一个总体,在一项具体的调查项目中,调查总体必须是明确的而不能是模糊的
样本是总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成。因此,与总体一样,样本也是一个集合。每个被抽中进入样本的单位称为入样单位。样本中包含的入样单位的个数称为样本量。抽样调查中调查的具体实施是针对样本而言的
总体参数与样本统计量
总体参数是我们所关心变量的数字特征,它是根据总体中所有单位的数值计算的。例如,在对北京市个体商业进行的调查中,北京市个体商业的年零售总额就是一个总体参数
样本统计量是根据样本中各单位的数值计算的,是对总体参数的估计,因此也称为估计量。样本统计量是一个随机变量,它取决于样本设计和正好被选入样本的单元特定组合。例如,用样本中员工的平均工资来估计该公司所有注册在职人员的平均工资,这里,样本中员工的平均工资是该公司所有员工平均工资的一个估计量
抽样框
抽样框是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。在抽样框中,可以对每个单位编上一个号码,由此可以按一定随机化程序进行抽样,在抽样后,调查人员也可以根据抽样框上所提供的信息找到被选中的入样单位,从而实施调查
概率抽样与非概率抽样
根据抽取样本方法的不同,可以将抽样分为概率抽样和非概率抽样两类
1. 概率抽样也称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的方法。概率抽样具有以下特点
1. 按一定的概率以随机原则抽取样本。所谓随机原则,就是在抽取样本时排除主观上有意识地抽取调查单元的情况,使每个单元都有一定的机会被抽中
2. 总体中每个单元被抽中的概率是已知的,或者是可以计算出来的
3. 当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率。也就是说,估计量不仅与对样本单元的观测有关,也与样本单元被选入样本的概率有关。概率抽样中,如果每个单位被抽入样本的概率相等,则称这种抽样方法为等概率抽样;如果每个单位被抽入样本的概率不同,则称为不等概率抽样。无论等概率或不等概率抽样,抽取时都要通过一定的随机化程序来实现
2. 非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不是依据随机原则。这类抽样有许多不同的具体抽取样本的方法,下面列举一些主要的方法
1. 判断抽样。这是指在抽取样本时,调查人员依据调查目的和对调查对象情况的了解,人为确定样本单元。例如,选择“平均型”单元作为样本,选定的样本可以代表所研究变量的平均水平
2. 方便抽样。这是指在抽取样本时,依据方便原则,以达到最大限度降低调查成本的目的。比如“拦截式”调查,在街边或居民小区拦住行人进行调查
3. 自愿样本。这是指不是经过抽取,而是由自愿接受调查的单元所组成的样本。比较典型的是网上调查
4. 配额抽样。这是指将总体中的各单元按一定标准划分为若干类型,将样本数额分配到各类型中,从各类型中抽取样本的方法则没有严格限制,一般采用方便抽样的方法抽取样本单元
抽样调查的一般步骤
1. 确定调查问题
确定调查问题所要回答的是“要做什么样的调查研究”和“为什么要做这项调查研究”。在这个过程中需要明确地定义问题,包括对整个问题的叙述以及确定研究问题的具体组成部分
2. 调查方案设计
这一阶段,要明确如何实施调查,主要包括抽样方案的设计和问卷设计。抽样方案描述如何抽取样本,问卷设计则将比较抽象的调研问题逐步细化,演变为现场调查中采访者询问的、比较具体的问题的工作过程
3. 实施调查过程
在这个过程中要获得样本单元的调查数据,关键的问题是要保证原始数据的质量,这就需要对调查过程进行有效的管理和监控。在调查过程中,要有管理制度和措施,使得从事具体调查的人员有章可循,按章操作
4. 数据处理分析
这个过程包括对调查获得的原始数据进行检查、核对,对验收合格的数据进行编码和录入,对录入的数据进行预处理,对数据进行统计分析,对总体参数进行估计等
5. 撰写调查报告
调查报告是调查活动的最终成果,是前面劳动成果的展现
抽样调查中的误差
样本估计值和总体参数真值之间的差异称为误差,调查中的误差可以分为抽样误差和非抽样误差两大类
1. 抽样误差是由于抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。对任何抽样方案,都会存在许多待选样本,实际中抽到的只是其中一个样本。抽到哪一个样本完全是随机的,而抽到不同的样本,对总体的估计就会不同,这就是抽样误差产生的根本原因
2. 非抽样误差是指除抽样误差以外,由其他原因引起的样本统计量与总体真值之间的差异。非抽样误差产生的原因主要有以下三种
1. 抽样框误差
例如,用市场监督管理局签发的营业执照作为个体商业的抽样框,对个体商业实施抽样调查,以掌握个体商业零售额的情况。但有些个体商贩是无照经营,这部分零售额就会漏掉
2. 无回答误差
现场调查中由于各种原因,调查人员没能从被调查者那里得到所需要的数据
1. 一类是由于随机因素造成的,如调查时被调查者恰巧不在家,这种无回答减少了有效样本量,会造成估计量方差增大
2. 另一类无回答是非随机因素的影响,如被调查者不愿告诉实情而拒绝回答。第二类情况下,回答者与不回答者在调查指标上存在数量的差异,调查的结果中只有回答者的信息,却没有无回答者的信息。这类无回答不仅造成估计量方差增大,还会带来估计偏差
3. 计量误差
计量误差是指由于调查所获得的数据与其真值之间不一致造成的误差。这种误差可能是由调查人员、问卷设计、受访者等原因造成的
几种基本概率抽样方法
1. 简单随机抽样
简单随机抽样分为有放回简单随机抽样和不放回简单随机抽样两种方法
1. 有放回简单随机抽样是指从总体中随机抽出一个样本单位,记录观测结果后,将其放回总体中去,再抽取第二个,以此类推,直到抽满n个单位为止
采用这种方法,单位有被重复抽中的可能。这种抽样方法容易造成信息重叠而影响估计的效率,所以较少采用
2. 不放回简单随机抽样是指从包含N个单元的总体中逐个随机地抽取单元并不放回,每次都在所有尚未被抽入样本的单元中等概率地抽取下一个单元,直到抽取n个单元为止
采用这种方法,每个单元最多只能被抽中一次,故不会由于样本单位被重复抽中而提供重叠信息,所以比有放回抽样的抽样误差低
简单随机抽样方法的适用条件是
1. 抽样框中没有更多可以利用的辅助信息
2. 调查对象分布的范围不广阔
3. 体之间的差异不是很大
2. 分层抽样
分层抽样是指先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机地抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。分层抽样的优点如下
1. 分层抽样不仅可以估计总体参数,同时也可以估计各层的参数。例如,按照行业将某市所有中小企业进行分层,进行就业人口的抽样调查,最终不仅能估计全市中小企业就业的相关指标,还可以在各行业进行推算
2. 便于抽样工作的组织。例如,某项全国范围的大型抽样调查,要编制全国范围的抽样框往往是一件非常困难的事,但如果按行政区划或行业分层后,可以调动各级主管部门的积极性,分头编制抽样框并实施抽样的组织和调查工作抽样方法
3. 每层都要抽取一定的样本单位,这样样本在总体中分布比较均匀,可以降低抽样误差
分层抽样中,样本量在各层中分配的方法可以归为两类,等比例分配和不等比例分配
1. 等比例分配是指层中单位数越多,在该层中抽取的样本单位就越多,该层的样本单位比例与该层中的总体单位比例相一致,即nh/Nh=n/N。这里n为样本量,nh为第h层的样本量,N为总体单位数,Nh为第h层的总体单位数
2. 有些情况下需要使用不等比例分配方法。比如各层单位数相差悬殊,如果按等比例抽样,总体单位数少的层所分到的样本量过小,代表性不足,就需要在该层适当增大样本量;或者有些层内的方差过大,为了降低抽样误差,在方差大的层中多抽,在方差小的层中少抽,这些都属于不等比例抽样。显然,在条件具备时,如果各层的总体方差已知,不等比例抽样的抽样误差可能比等比例抽样更小
分层抽样的应用条件是
抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内各单位之间的差异尽可能地小,不同层之间各单位的差异尽可能地大
3. 系统抽样
系统抽样是指先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元
最简单的系统抽样是等距抽样,即将总体N个单位按直线排列,根据样本量n确定抽样间隔,即抽样间隔为N/n≈k,k为最接近N/n的一个整数。在1~k范围内随机抽取一个整数i,令位于i位置上的单位为起始单位,往后每间隔k抽取一个单位,直至抽满n
系统抽样的优点是
1. 操作简便。它只需要随机确定起始单位,整个样本就自然确定了。
2. 对抽样框的要求也比较简单。它只要求总体单位按一定顺序排列,而不一定是一份具体的名录清单
系统抽样的缺点是方差估计比较复杂,这就会给计算抽样误差带来一定困难
系统抽样的估计效果与总体单位排列顺序有关
1. 如果排列顺序与调查内容有关,称为按有关标识排列。按有关标识排列的系统抽样精度一般比简单随机抽样的精度高
2. 如果排列顺序与调查内容没有联系,称为按无关标识排列,这时系统抽样估计与简单随机抽样估计效率相仿
4. 整群抽样
整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部基本单位,对没有抽中的群则不进行调查
例如,欲调查某市在职的房地产行业人员工资水平,将房地产行业所有在职人员按照所属企业分群,直接抽取企业单位,入样的企业单位内所有职工均接受调查,没有入样的企业单位员工都不调查
整群抽样的优点有
1. 实施调查方便,可以节省费用和时间。在总体单位分布很广的条件下,若采用简单随机抽样,样本的分布十分分散,调查实施有一定难度,费时费力。而群中各单位的分布非常集中,抽中一个群以后,在一个点上可以调查多个单位,调查效率较高
2. 抽样框编制得以简化,抽样时只需要群的抽样框,而不要求全部基本单位的抽样框。例如,调查房地产行业在职人员工资水平时,没有所有员工名单的抽样框,但是有当地房地产企业的抽样框,所以可以依据该抽样框抽取单位,然后对抽中的企事业单位,调查其所有在职人员的工资
整群抽样的主要缺点
由于抽取的样本单位比较集中,群内各单位之间存在相似性,差异比较小,而群与群之间的差别往往比较大,使得整群抽样的抽样误差比较大。为了达到一定的误差要求,就有必要增大样本量,如多抽取一些群进行调查。但是,如果群的构造是相反的情况,即群内各单位之间存在较大的差异,而群与群的结构相似,整群抽样反而会降低估计误差
例如,以家庭为群,采用整群抽样估计某地区的男女比例,家庭内成员之间存在很大差异(有男有女),而家庭与家庭之间的性别结构却十分相似(同样也是有男有女),在这个背景下,整群抽样估计男女比例的误差就低于简单随机抽样。所以,整群抽样特别适合于对某些特殊群结构进行调查
5. 多阶段抽样
在大规模抽样调查中,一次抽取到最终样本单位是很难实现的,往往需要经过两个或两个以上阶段才能抽到最终样本单位,这就是多阶段抽样方法
首先从总体中采用随机方法抽取若干个小总体,称为初级单元;再在这些选中的初级单元中随机抽取若干个单位。如果经过两个阶段抽样,抽取到接受调查的最终单位,称为二阶段抽样;如果经过三个阶段才抽取到接受调查的最终单位,称为三阶段抽样,以此类推。所以,多阶段抽样是对经过两个及两个以上抽样阶段的抽样方法的统称
多阶段抽样是分阶段进行的,抽样框也可以分级进行准备。在第一阶段抽样中,只需准备总体中关于初级单元的抽样框;在第二阶段抽样中,仅在那些被抽中的初级单元中准备第二阶段抽样所需的抽样框。其次,因为多阶段抽样是在选中的单位中进行再抽选,这样就使样本的分布相对集中,从而可以节省调查中的人力和财力
估计量和样本量
估计量的性质
1. 估计量的无偏性
对于不放回简单随机抽样,所有可能的样本均值取值的平均值总是等于总体均值,这就是样本均值估计量的无偏性
2. 估计量的有效性
在同一抽样方案下,对某一总体参数θ,如果有两个无偏估计量θ1和θ2,由于样本的随机性,θ1的可能样本取值较θ2更密集在总体参数真值θ附近,人们会认为θ1比θ2更有效
由于方差是度量分布密集或离散状况的重要指标,估计量方差常用于描述抽样误差。估计量方差越大,说明用可能的样本估计值之间的差异越大,用样本统计量估计总体参数的效率就越低,抽样误差越大。因此,θ1比θ2更有效,必然有Var(θ1)<Var(θ2),即θ1的方差小于θ2的方差
3. 估计量的一致性
随着样本量的增大,估计量的值如果稳定于总体参数的真值,这个估计量就有一致性,可称为一致估计量
抽样误差的估计
以不放回简单随机抽样下均值估计量为例,简要介绍估计量方差的估计方法。
假设从总体的N个单元中按照不放回简单随机抽样方法抽取n个单元作为样本,用Y1,Y2,…,Y表示总体关于变量Y的N个观测值,用y1,y2,…,yn表示样本中的n个观测值。把样本均值y均值作为总体均值Y的估计量,则估计量y的方差为
实践中,总体方差S2是未知的,可以利用样本方差来估计,因此估计量方差的估计公式为
抽样误差与总体分布有关,总体单位值之间差异越大,即总体方差S²越大,抽样误差就越大
抽样误差与样本量n有关,在其他条件相同情况下,样本量越大,抽样误差就越小。此外,抽样误差与抽样方式和估计量的选择也有关系。例如,分层抽样的估计量方差一般小于简单随机抽样。利用有效辅助信息也可以有效地减小抽样误差
样本量的计算
通常情况下,样本中所包含的样本单位数量(样本量,n)增大,相应样本估计量的抽样误差会减小;反之,样本中所包含的样本单位数量(样本量,n)减少,相应样本估计量的抽样误差会增大。在实际应用中,样本量的确定主要应考虑以下几方面因素
1. 调查的精度
调查的精度是指用样本数据对总体进行估计时可以接受的误差水平。要求的调查精度越高(误差水平越小),所需要的样本量就越大
2. 总体的离散程度
在其他条件相同情况下,总体方差越大,所需要的样本量也越大
3. 总体的规模
。对于大规模的总体,总体规模对样本量的需求几乎没有影响。但是对小规模的总体,总体规模越大,为保证相同估计精度,样本量也要随之增大(但不是同比例的)
4. 无回答情况
无回答减少了有效样本量。在无回答率较高的调查项目中,样本量要大一些,以减少无回答带来的影响
5. 经费的制约
调查经费是影响样本量的一个十分重要的因素。事实上,样本量是调查经费与调查精度之间的某种折中和平衡
6. 调查的限定时间、实施调查的人力资源也是影响样本量的客观因素
其中,N为总体规模,当总体规模很大(N大于10000)时,总体规模N对样本量n的影响较小,样本量n接近于n0。ua为标准正态分布的双侧a分位数,在置信度(1-a)为95%时u值为1.96。d为绝对允许误差,用于表示一定的置信度(1-a)下样本估计值θ与总体参数θ之间的误差不超过某一给定的最大可能范围Pr(|θ-θ|≤d)=1-a,允许误差越小,表明人们就越相信抽样结果接近于“真实”。S²为总体方差,总体方差S²未知时,一般用样本方差s²替代。在比例估计中,若P为总体比例,则总体方差S²计算公式为P(1-P)