导图社区 人卫第8版《卫生统计学》——第三章《数据的产生》
本思维导图为人卫第8版《卫生统计学》第二章《数据关联的探索》的内容,本章学习的重点:1、”抽样分布与总体分布“,难度较大,并且是后续章节的基础,只有掌握这两者的区别和概念,才能理解后续的知识点
编辑于2022-08-04 17:51:07 广东社区模板帮助中心,点此进入>>
第三章 数据的产生
1、第三章回答“为什么做”的问题 2、第十四章、第十五章回到“怎么做”的问题
随机对照实验设计原则
设计原则
对照
首要原则
目的:设置对照组以减少非处理因素对处理因素效应的影响
安慰剂效应:在医学研究中患者由于心理效应所产生的虚假现象
安慰剂也可看成是某种“处理”,比如给予外表为药物的糖果进行治疗也会使患者感觉有效。人们会对受到关注的或自认为有帮助的处理出于心理作用作出反应
标准的对照试验:将试验对象随机分配到试验组和对照组,除了对试验组给予处理措施外,两组患者在其他方面都应被同等对待
随机化
通常情况
研究者按照某些条件对研究对象进行匹配后再随机分配到各组
匹配可能对试验有所帮助,但不一定能完全避免偏倚
1、有太多潜在的变量可能影响试验的结果,我们很难把所有的因素都进行匹配
2、一些重要的变量无法测量
3、研究者可能会在不知不觉中根据患者的基本信息作出违背随机话原则的行为
统计学的处理方法
每个试验对象被配分到各处理组中的机会与试验对象的特征无关,并不以研究者的意志为转移
最简单的方法:保证每一个试验对象有相同的机会进入任一处理组
随机化
保证每一个试验对象有相同的机会进入任一处理组
随机化构建除处理因素外各方面都相似的两组对象,从而反映实验组与对照组的差异来源于处理因素
两组试验对象的试验效应应归因于处理因素或某类试验对象被分配到两组的机会
重复
主要指对多个实验对象进行处理以减少实验的随机变异
潜在问题
安慰剂效应
研究者存在对处理因素的主观看法而造成实验结论的偏倚
如果研究者知道试验对象的组别是试验组或对照组,如结局指标具有主观性,则研究者在判定结果时就有可能掺杂自己的主观感受。→解决:盲法(试验对象甚至研究者均不知道试验对象接受哪一种处理,从而避免了由研究者和试验对象的主观意识造成的偏倚)
简单随机抽样
总体
根据研究目的确定的同质研究个体的全体
样本
是为了了解总体而观测的总体的一部分
简单随机样本
从总体中以相同机会抽取的n个个体称为一个简单随机样本,n为样本量
降低选择偏倚——相当于试验研究中的随机化
如果不采用简单随机抽样,得到的样本可能不具有代表性
潜在的问题
涵盖不全
总体列表难以获得
志愿者应答样本
总体中的更有意愿完成调查的部分对象组成的样本
有极端意见的对象更有医院进行回应,因此不是总体的一个具有代表性的样本
应答偏倚
当问题涉及与法律、伦理道德有关的敏感话题时,被访者可能撒谎、
即使样本代表性很好也会由于测量可能存在的缺陷得到有问题的数据
回忆偏倚
参数与统计量的概念及其关系
统计推断
从样本数据推理而得到关于总体的结论
基本想法:用样本得到的结论来“猜测”总体的真相
参数
用于刻画总体的数值特征,如总体的均数、总体中位数、总体标准差、总体率等。参数被看成总体某种特征的固定数值,通常参数的确切值未知、
统计量
用于描述样本的数值特征,如样本均数、样本中位数、样本标准差、样本率等。当获得一个样本后就可以得到统计量的值,可用于估计未知参数的值。统计量随样本改变而改变
关系
当用统计量来估计总体参数时,统计量会随着抽样结果的不同而不同,该现象可能影响我们采用统计量来估计总体参数的质量
由抽样引起的统计量与统计量之间或者统计量与总体阐述之间的变化具有某种潜在的模式,本章将定性回答这个问题。
在第五章中运用第四章知识定量回答这个问题
抽样分布与总体分布
统计量抽样分布
统计量的分布规律,描述了从同一总体重复抽样时,统计量会有些什么样的值,以及每个值出现的可能性大小
样本均数的离散程度远小于个体观测值的离散程度,样本均数的变异程度小于个体观测值
重复抽样过程
从总体中进行简单随机抽样,每次抽取的样本量为n
计算出统计量(样本均数x-或者样本率p)
重复上述两步
展示多个统计量(样本均数x-或者样本率p)的分布特征
总体分布
总体中所有个体观测值的分布
抽样误差与偏倚
抽样误差
统计量的值在重复随机抽样的样本中各不相同,这种统计量随着样本的变化而变化的现象称为抽样变异
抽样分布
从同一总体抽取样本量相同的样本,这些统计量的值构成的分布
标准误
统计量的标准差,反映了由抽样引起的统计量于总体参数之间或统计量取值之间的差异,定量刻画了抽样误差的大小
用样本均数估计总体均数时,可以借助均数的标准误的大小来帮助判断估计的可靠性
来自随机样本的统计量,其变异大小不依赖于总体的大小
统计量的变异由样本量控制,从上亿个成年人中抽取样本量为2500的简单随机样本和从上百万个成年人中抽取同样大小的样本得到的结果的可靠性是近似的
简单随机抽样等方法可以降低偏倚→样本具有代表性
但不能消除偏倚
样本量越大→统计量的变异就越小
偏倚
抽样分布的均值与待估计参数的差值称为统计量的偏倚,当偏倚为零时,则称该统计量时相应参数的无偏估计。
偏倚关注的是抽样分布的集中位置
如果研究结果与真是结果之间存在方向性的偏离,那么就存在偏倚,样本不具备代表性
偏倚与变异的箭靶示意图
高偏倚,低变异
低偏倚,低变异
高偏倚,高变异
低偏倚,高变异
补充
数据的质量
测量导致的数据
真实性
可靠性
统计推断时样本的
代表性
可靠性
明确的研究目的和严谨的设计是数据质量的基本保障
抽样调查和实验研究是最常见的两种统计设计和数据收集方式
数据的来源
轶闻数据
通常指由杂志、报纸、电视、互联网或其他媒体报道的一些个案数据,由于其特殊往往给公众留下突出和深刻的印象
缺点
缺乏代表性,往往诱导人们进行简单的推论,得到一些具有倾向性的结论
优点
有时可以给我们提高线索,为下一步研究确定、选择研究方法等提供参考
可得数据
是指为了某些特定目的的已收集或累积的数据
来源
各类监测数据
医院临床病案数据
各类统计年检
公共数据库
普查
特点
免费或以非常低廉的价格获取
缺点
通常难以完全满足某些特定的研究目的
抽样调查数据
抽样调查
通过选择和测量来自总体的样本来收集数据
基本思想:对总体中的一部分,即样本进行了解进而得到总体的信息
观察性研究
客观地观察、记录和描述事物或现象的认识活动,其显著特征是对于处于自然状态下的事物或现象进行观察
特点
观察者对被观察事物或现象在不进行任何干预的情况下所作的观察
规避道德风险
局限
每个观察对象所处的状态(吸烟与否)无法由研究者决定
两者的关联可能来源于其他混杂因素
实验研究数据
实验性研究
特点
研究对象所处的状态是由研究者决定的
干预措施:研究者决定研究对象状态的过程
可比性更好、因果关系的推断更具说服力
局限
存在伦理问题
随机对照试验
伦理问题
基本的数据伦理
知情同意
数据保密性
伦理委员会审查