导图社区 数据的搜集
数据的搜集知识梳理,包括数据的直接来源和间接来源、原始数据收集的调查方法和数据的误差等等。
条形图的类别可以横置也可以纵置,类别放在横轴,称为柱形图、按各类别数据出现的频数多少排序后绘制的条形图(主要用于分类数据)
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
数据的搜集
数据的来源
间接来源
二手数据
特点
搜集容易
采集成本低
评估
数据是谁搜集的(who)
为了什么目的搜集的(what)
怎样搜集的(how)
在哪里搜集的(where)
什么时候搜集的(when)
直接来源
实验数据
通过实验方法得到的数据
通常是对自然现象而言
也被广泛运用到社会科学中
调查数据
通过调查方法获得的数据
通常是对社会现象而言
通常取自有限总体
原始数据的搜集
调查方法
概率抽样
简单随机抽样
定义:随机抽取,每个单位入抽样本的概率(入样概率)相等
规模较大调查中较少采用
特点:①简单、直观;②可直接抽取;③估计方便
局限性:①N很大时不易构造抽样框;②抽出单位很分散时实施调查困难;③无其它辅助信息提高估计效率
分层抽样
定义:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本
优点:①保证样本的结构与总体的结构比较相近,从而提高估计的精度;②组织实施调查方便;③既可以对总体进行估计,也可以对各层估计
整群抽样
定义:将总体若干单位合并为组(群),直接抽取群,然后对群中所有单位全部实施调查
特点:①抽样时只需群的抽样框,可简化工作量;②调查的地点相对集中,节省调查费用,方便调查的实施
缺点:估计的精度较差
系统抽样
定义:将总体中所有单位按一定顺序排列,在规定的范围内随机抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位
特点:操作简便,可提高估计的精度
缺点:对估计量方差的估计比较困难
多阶段抽样
先抽取群,从选中的群中再抽取单位调查
具有整群抽样的优点
需包含所有低阶段抽样单位的抽样框;同时由于实行再抽样,范围更广泛
大规模抽样调查中,经常被采用的方法
非概率抽样
方便抽样
具有整群抽样的优点,保证样本相对集中
由调查员方便原则,自行确定入抽样本单位
优点:容易实施,调查的成本低
缺点:样本单位的确定随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体
判断抽样
研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本
类型
重点抽样:抽取反映主要情况或基本趋势的样本(通常是在总体中有举足轻重、能够在很大程度上代表总体的基本情况,样本单位尽量少,其值在总体中所占比重应尽量大)
典型抽样:典型单位要具有研究问题的本质或特征
代表抽样:有典型抽样的含义
优点:成本比较低,容易操作
缺点:人为确定,不能用于对总体有关参数进行估计
自愿样本
被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息(参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等)
自愿样本与抽样的随机性无关:①样本是有偏的;②不能依据样本的信息推断总体
滚雪球抽样
先选择一组调查单位,实施调查后,请他们提供另外一些属于研究总体的调查对象,根据所提供线索,进行此后的调查。
适合对稀少群体和特定群体研究
优点:①容易找到特定群体被调查者;②调查成本低
配额抽样
类似分层抽样,每类中采用方便或判断抽样
操作简单,可保证总体中不同类别的单位都能包括在所抽样本中,使样本结构和总体结构类似
数据的误差
抽样误差
由于抽样的随机性所带来的误差
所有样本可能结果与总体真值间平均性差异
影响抽样误差的大小的因素
样本量大小
总体的变异性
非抽样误差
除抽样误差外,其他原因造成的样本观察结果与总体真值之间的差异
存在于所有的调查之中:概率抽样,非概率抽样,全面性调查
有抽样框误差、回答误差、无回答误差、调查员误差、测量误差