导图社区 数据的搜集
统计学第七版贾俊平第二章数据的收集知识总结,包括数据的直接来源、间接来源、搜集数据的基本方法、数据搜集方法的选择、数据的误差等。
社区模板帮助中心,点此进入>>
马克思主义原理
考研数学重点考点知识总结归纳!
数据结构
法理学读书笔记
思维导图带你认识马克思主义原理
建筑光学基本知识
考研英语一写作
考研复习知识点之史纲思维导图。
教育学考研:教育学原理第八章教学内容整理
考研三步翻译技巧
数据的收集
直接来源
调查数据
通过调查方法得到的数据
针对社会现象
取有限总体 即总体所包含的个体单位是有限的
实验数据
通过实验方法得到的数据
针对自然现象
在实验中控制实验对象所搜集到的变量的数据
间接来源
二手资料(对原信息重新整理,可以使用的数据)
优点
搜集方便
数据采集快
采集成本低
局限性
针对性不够
资料的相关性不够
口径可能不一致
数据也许不准确,也许过时
作用
分析所要研究的问题
提供研究问题的背景
帮助研究者更好地定义问题
检验和回答某些假设和疑问
寻找研究问题的思路和途径
对二手资料评估的内容
who
why
when
how
搜集数据的基本方法
自填式
在没有调查员协助的情况下由被调查者自己填写,完成调查问卷
调查员组织管理相对容易;
调查成本最低, 增大样本量对调查费用影响很小, 可进行大范围的调查;
减小被调查者回答敏感性问题的压力
缺点
不适合结构复杂的问卷, 对调查的内容有局限;
调查周期比较长;
难以及时调改措施解决数据收集出现的问题;
问卷回收率比较低
面访式
现场调查中调查员与被调查者面对面, 调查员提问、 被调查者回答
提高调查的回答率;
提高调查数据的质量, 利于识字率低的群体调查;
调查问题组合更科学合理;
可借助其他调查工具(图片、 卡片等)丰富调查内容;
可对花费时间进行调节
调查成本高;
对调查过程的质量控制有一定难度;
对于敏感性问题, 被调查者可能不愿当面回答
电话式
调查人员通过打电话的方式向被调查者实施调查
速度快, 能够在很短的时内完成调查;
成本低廉, 适合样本单位分散情况;
为调查员提供安全保障;
可及时处理调查中遇到的问题, 调查督导对访问实施监听容易
电话使用率不高的地区, 电话调查会受限制;
电话式访问的时间不宜过长;
答案过多会造成调查进度的延缓, 被调查者容易挂断电话;
被访者不愿意接受调查时, 要说服调查更为困难
观察式
调查人员通过直接观测的方法获取信息
数据搜集方法的选择
数据的误差
指通过调查搜集到的数据与研究对象真实结果之间的差异
类型
抽样误差
随机性误差,只存在概率抽样中
由于抽样的随机性引起的样本结果与总体真值之间的差异
非抽样误差
概率抽样,非概率抽样以及全面调查,都可能产生非抽样误差
抽样框误差
目标总体和抽样总体不一致时产生的误差
例:电话簿,对某地区所有住户进行调查
回答误差
理解误差,不同被调查者对调查问题的理解不同
例:在调查中使用“经常”“频繁”“偶尔” 等词
记忆误差,回忆长时间数据可能不准确
例:对于记忆类问题的调查
有意识误差,调查问题敏感,不愿意告知;受利益驱动,进行数字造假
例:调查纳税情况时,被调查者往往高报,以表现自己没有漏税行为
无回答误差
随机因素造成
例:邮寄的问卷丢失, 或调查时被访者正在生病, 无法接受调查
非随机因素造成
例:被调查者不愿告诉实情而拒绝回答
调查员误差
由于调查员的原因而产生的调查误差
例:调查员粗心, 在记录调查结果时出现错误
测量误差
由于测量工具产生的误差
例:视力的测定与现场的灯光、测试距离都有关系
影响因素
抽样单位的数目
数目越多,误差越小;反之,误差越大
总体的变异性
变异性越大,各单位之间的差异就越大,误差也就越大; 反之,各单位之间相似,误差越小
抽样方法的选择
分为重复抽样和不重复抽样,不重复抽样误差小
抽样组织方式不同
采用不同的组织方式, 会有不同的抽样误差,通常将抽样误差作为比较各种抽样组织方式优劣的标准。
如抽样框误差,无回答误差等等
误差的控制
改变样本量, 要求的抽样误差越小, 所需要的样本量就越大。
抽样框
构造抽样框时广泛地搜集有关信息, 改进抽样框;
无回答
①预防, 即在调查前做好各方面的准备工作, 尽量把无回答降到最低程度
②在无回答单位中再抽取一个样本, 实施更有力的调查, 并以此作为无回答层的代表, 和回答层的数据结合起来对总体进行估计;
理解
要注意问卷中的措辞, 一份好的调查问卷可以有效地减少理解调查误差
记忆
要缩短调查所涉及的时间间隔;
有意识
要注重对调查过程进行控制的具体措施, 对调查结果进行检验、 评估, 对现场调查人员进行奖惩的制度等。
概率抽样和非概率抽样的比较
②调查方法(非概率抽样)
①调查方法(概率抽样)