导图社区 统计学第2章数据的搜集
统计学第2章数据的搜集,数据的来源:概念:数据是由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以使用。
跨国公司内部贸易,跨国公司的转移定价策略:转移定价通常做法:调整子公司半成品或零部件的进出口价格、调整向子公司出售机器设备的价格和折旧期限。
计量经济学 第5章自相关性知识总结,包括自相关性定义产生的原因、自相关性的后果、自相关性的检验、自相关性的解决方法等。
计量经济学 第6章 多重共线性知识总结,包括多重共线性及其产生原因、多重共线性造成的影响、多重共线性的检验、多重共线性的解决方法等。
社区模板帮助中心,点此进入>>
英语词性
法理
刑法总则
【华政插班生】文学常识-先秦
【华政插班生】文学常识-秦汉
文学常识:魏晋南北朝
【华政插班生】文学常识-隋唐五代
民法分论
日语高考動詞の活用
第14章DNA的生物合成读书笔记
数据的搜集
数据的来源
数据的间接来源
概念:数据是由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以使用
从搜集范围
系统外部
统计部门和各级政府部门公布的有关资料、各类专业期刊报纸图书所提供的文献资料、各种会议资料,互联网图书馆
系统内部
业务资料,各种财务分析资料等
二手资料
优点
二手资料的搜集比较容易,采集数据的成本低,并且能很快得到。
缺点
二手资料并不是为特定的研究问题而产生的,所以在回答所研究的问题方面可能有所欠缺,如资料的相关性不够,口径可能不一致,数据也许不准确,或过时
数据的直接来源
概念:通过自己的调查或实验活动,直接获得第一手数据
分类
通过调查方法获得的数据称为调查数据(社会经济现象)
通过实验方法获得的数据称为实验数据(自然现象)
调查数据
概率抽样
概念:也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本
特点
抽样时是按一定的概率以随机原则抽取样本
每个单位被抽中的概率是已知的
1、简单概率抽样
概念:就是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的。
抽样框:通常包括所有总体单位
简单、直观
在抽样框完整时,可以直接从中抽取样本
由于抽选的概率相同,用样本统计量对目标量进行估计及计算估计量误差都比较方便
局限性
当N很大时,构造这样的抽样框并不容易
根据这种方法抽出的单位很分散,给实施调查增加了困难
这种方法没有利用其它辅助信息以提高估计效率
2、分层抽样
是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。
3、整群抽样
误差较大
将总体中若干单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中所有的单位全部实施调查,这样的方法称为整群抽样。
4、系统抽样
将总体中的所有单位(抽样单位)按一定顺序排列,在规定范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他单位样本,这种抽样方法称为系统抽样。
5、多阶段抽样
大规模抽样调查
采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是进一步抽样,从选中的群中抽取出若干个单位进行调查
非概率抽样
概念:是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查
1、方便抽样(随意抽样)
2、判断抽样
概念:指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本
实施时根据不同目的分类
重点抽样
是从调查对象的全部单位中选择少数重点单位,对其实施调查。这些重点单位的数量虽不多但在总体中占有重要地位
典型抽样
代表抽样
有主观性
3、自愿抽样
自愿样本与抽样随机性无关,样本有偏(尤其集中于对该调查活动感兴趣的人群)
4、滚雪球抽样
用于稀少群体
优点:容易找到那些属于特定群体的被调查者,调查成本较低
适合对特定群体进行研究的资料搜集
5、配额抽样
类似概率抽样中的分层抽样,广泛应用与市场调查
首先将总体中所有的单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位
概率抽样与非概率抽样的比较
1、非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因此无法使用样本的结果对总体相应的参数进行推断
适合探索性的研究,调查结果用于发现问题(适合市场调查中的概念测试如产品包装测试,广告测试)
2、概率抽样依据随机原则抽选样本,这使样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计
搜集数据的基本方法
1、自填式
是指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷
1、应有制作详细、形象友好的说明
2、要求被调查者有一定的文化素养
3、管理容易,调查成本低(可进行大范围调查)
4、一定程度上可减少被调查者回答敏感问题的压力
1、问卷的回收率较低
2、自填式方法不适合结构复杂的问卷
3、对于在数据搜集过程中出现的问题,一般难以及时采取调改措施
2、面访式
指现场调查中调查员与被调查者面对面,调查员提问、被调查者回答是这种调查方式
1、调查员可以激发被调查者的参与意识,提高调查率
2、可对被调查者的回答进行鉴别澄清,提高数据质量,可对识字率低的群体实施调查
3、能够对数据收集所花费的时间进行调节
1、调查成本高
2、对调查过程的质量控制方面有一定难度
3、电话式
特点:
1、速度快
2、适合样本单位十分分散的情况
3、成本低
4、对访问过程的控制比较容易
4、数据搜集方法的选择(考虑的问题)
抽样框中的有关信息
目标总体的特征
调查问题的内容
有形辅助物的使用
实施调查的资源
管理与控制
质量要求
实验数据
是指在实验中控制实验对象而搜集到的数据
实验组和对照组
实验组:是指随机抽选的实验对象的子集。在这个子集中,每个单位接受某种特别的处理
对照组:每个单位不接受实验组成员所接受的某种特别的处理
实验中的若干问题
1、人的意愿
2、心理问题
3、道德问题
数据的误差
指通过调查搜集到的数据与研究对象真实结果之间的差异
抽样误差
不可避免,可以控制
是由抽样的随机性引起的样本结果与总体真值之间的误差
影响因素
样本量大小
总体变异性
变异性越大,抽样误差越大
非抽样误差
可以避免
是指除去抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异
类型
1、抽样框误差
2、回答误差
(1)理解误差
(2)记忆误差
(3)有意识误差
3、无回答误差
4、调查员误差
5、测量误差
区别与联系
抽样误差是一种随机误差,只存在于概率抽样中
非抽样误差,无论是概率抽样、非概率抽样或是在全面调查中,都有可能产生非抽样误差
系统抽样:每隔一小时抽一件;整群抽样:每隔一小时抽五分钟