导图社区 医学统计学 第一章 绪论
这是医学统计学第一章绪论的内容,医学统计学是用统计学原理和方法研究生物医学问题的一门学科。它运用概率论与数理统计的原理和方法,对生物医学数据的搜集、整理、分析和推断进行研究。
编辑于2024-11-16 20:42:04医学统计学:第一章 绪论
一、关于医学统计学
什么是医学统计学
“A branch of mathematics dealing with the collection, analysis, interpretation, and presentation of masses of numerical data.”(Webster's International Dictionary)
“The science and art of collecting, summarizing, and analyzing data that are subject to random variation.” (A Dictionary of Epidemiology).
一门交叉学科
统计学:处理数据中变异性的科学与艺术
内容:收集、分析、解释和表达数据
目的:求得可靠的结果
统计学的现实地位:合作、审稿、基金申请 (NIH)、 药物开发与申报(FDA)、卫生决策
医学与统计学的磨合
PierreCharlesAlexandre Louis (1787-1872) ——循证医学奠基人
伤寒放血疗法的评价
Galton Sir Francis Galton (1822-1911) ——第一位定量遗传学家
最早利用量表,定量研究了有成就的人及 其家庭,发现智力也有遗传 最早发明回归直线和相关分析 定量研究遗传规律, 发现“regression toward the mean”这一普遍现象疗法的评价
Karl Pearson (1857–1936) ——现代统计学之父
1894年,开出第一门统计学理论的高级课程 1901年, 创办第一份统计学杂志Biometrika,发表他和他的生物统计 学派的研究成果
Ronald A. Fisher (1890-1962) ——首创随机对照试验
《Statistical Methods for Research Workers》 (1925), 《Design of Experiments》 (1935) 提出对付误差的三原则:对照(Control)、随机化(Randomization) 和适当组织 (Relevant organizing) “为了由局部推断整体,统计学家在实验的设计阶段就必须参与” “做完实验后才找统计学家,就好像要他作尸体解剖。他会说,这实验‘死’于什么原因。” 注:适当组织比重复更广泛
Austin Bradford Hill (1897-1991) ——随机化临床试验的先锋
链霉素治疗肺结核的临床试验:病人随机地分到链霉素加卧床休息组和单纯卧床休息组; X光片由两位放射学家和一位临床学家独立评价(注:评价结果的人必须相互独立); 《Principles of Medical Statistics》:“相对而言,医生个人的临床经验是无计划、杂乱的,而且是非常不可靠的” 成功说服英国医学界,将Fisher的实验设计原理导入医学试验。
Jonas Salk (1914-1995) ——史上最大规模、花费最多临床试验
1954年在美国实施了一项临床试验旨在评价疫苗预防小儿麻痹或死于脊髓灰质炎的效果。180万儿童参与,花费超过500万美元 开始时随机化分组遇到一些阻力,最后约有1/4参与者得到了随机化。最终肯定了该疫苗的效果, 命名为Salk疫苗。 此后,美国FDA为临床试验规定了一整套制度,使之成为确定药物疗效的标准方法(注:新药临床试验必须要有详尽的统计学报告)。
二、统计学与公共卫生的互动
统计学是公共卫生工作者的有力工具
与临床医生治疗个体病人不同,公共卫生考虑的是群体的规律。
公共卫生对统计学天然的亲和,公共卫生专业人员视统计学为必备素养:
设计群体调查
抽样技术
疾病和卫生资源的分布特征
统计描述
在偶然性的背景中识别危险因素
统计推断
评价卫生措施
科学决策
大量数据分析的基础上建立结论和政策
公共卫生是统计学的用武之地与发展动力
Graunt(1620-1674)寿命表,开创人口统计学;
Graunt 发展了最早的人口统计和普查方法,创造了第一个寿命表,给出了各年龄的生存概率,为人口统计学奠定了基础。
William Farr (1807-1883)英国出生和死亡注册局医学统计官。他建立了一套常规的死亡人数和死因的汇编系统。他进一步改进寿命表方法,在英国创造了世界上最好的官方生命统计系统;
蒋庆琅ChinLong Chiang (1914-2014)以现代统计学和随机过程的观点系统研究了古老寿命表的原理,使之成为生物统计学的重要组成部分;以世界卫生组织顾问的身份推动了寿命表在国际范围的应用,直至如今。 1987年, 获"The Berkeley Citation” 奖。
Snow(18131858)首次详细研究了伦敦霍乱流行。应用了数学和统计学建模和分析。
Doll和Hill 吸烟与肺癌的创新性研究。
英国生理学家,将流行病学发展成严格的科学。证明吸烟引发肺癌,增加心血管疾病风险: (1) Casecontrol study (病例对照研究)1948-1949 (2) Cohort study (队列研究) 1951
公共卫生对统计学的挑战
非感染性疾病
众多危险因素的分析
生存时间的分析
疾病自然史的模型
化学毒物或药物评价
动物实验
定性检验:处理组和对照组之间的比较来确定化学物是否对人体引起有害健康的效应;
危险度定量评价:借助复杂的统计模型。
人群药物代谢动力学:统计学几个分支交叉结合
遗传流行病学
父母向子女的传递
同胞对内部的异同
缺失数据
艾滋病研究
总体成员及其规模往往未知
个体感染和发病的起点未知
发展了逆向估计、捕获再捕获等新的抽样与估计方法
卫生服务研究
成本效果分析、成本效益分析
三、 关于《医学统计学》课程
国外也有类似的课程
《Medical Statistics》 《 Biometrics 》 《Biostatistics》 《Statistics in Public Health》 《Statistics for Health Professionals》
课程计划
第一部分
统计描述 (Statistical description)
表格与图形 (Table and Plot, Louis)
寿命表 (Life table,Chiang)
统计推断 (Statistical inference)
t检验,x2 检验(Pearson)
方差分析 (Fisher)
相关与回归 (Galton)
第二部分
统计设计(Statistical design)
干预研究(Interventional study,Fisher)
动物实验(Animal experiment,Fisher)
临床试验(Clinical trial,Louis)
观察性研究(Observational study, Doll & Hill)
现代统计(Advanced Statistics)
多重回归(Multiple regression)
Logistic 回归 (Logistic regression)
Cox 回归 (Cox regression)
Meta 分析(Meta analysis)
目的与方法
统计思维享用一生
事件的不确定性 (Laplace)
由样本推断总体,结论的不确定性——有可能犯错误 (Pearson)
统计学任务:限定犯错误概率的大小, 在此前提下,作决策
掌握概念是首位
研究设计的原则 (Fisher)
确定样本量的依据
参数估计的精度
决策的两类错误
案例辨析:在辨析中提高,从反面吸取教训
重在理解和解释结果
通过计算,体验统计概念和思想
正确理解、解释和表达计算结果
中英文结果报告:内容齐全,表达规范
电脑实验与课堂讨论
用电脑模拟现实世界,从实验中看随机现象
统计软件——“看家本领”!
讨论与争论
四、几个重要
总体与样本
总体 (population): 大同小异的对象全体
目标总体(target population): 试图下结论的某个总体。例如,英国成年男子为目标总体
研究总体(study population) : 资料来源的较小的总体。例如,1951年英国全部注册医生
抽样(sampling):从研究总体抽取部分个体
样本(sample) :抽取的部分个体
数据(data):观察所得资料
信息(information):数据分析的产物
推断(inference): data→information→knowledge
统计推断的工具:Probability Theory
需要注意: 推断的结论从来不是完全肯定或完全否定
关键与核心:抽样方法、样本的代表性和推断的方法
同质与变异
同质性(homogeneity) :共性,大同小异
变异(variation) :个体差异,多样性
没有同质性就构不成一个总体;
总体内没有变异性就无需统计学。
统计学的任务:在变异的背景上,描述同一总体的同质性,揭示不同总体的异质性 (heterogeneity)。
变量
定性变量(Qualitative variable)
分类变量(Categorical variable)/名义变量(Nominative variable)
类别/水平 (Level):代码(Code) 用1、2、3、4、5等表示水平(注:不是数字,而是代码)
类如职业中1代表农民,2代表职工,3代表无业等
二分类变量(Binary variable)/假变量(Dummy variable)
性别、存活/死亡等
有序变量 (Ordinal variable)
种种可能的“取值”中自然地存在着次序
痊愈、好转、无效、死亡等顺序
定量变量(Quantitative variable)
离散型变量 (Discrete variable)
只能取整数值, 例如,手术病人数、 新生儿数
连续型变量 (Continuous variable)
可以取实数轴上的任何数值;
由测量而得到的大多属于连续型变量
例如,血压、身高、体重等
“连续”: 变量可在实数轴上连续变动
变量类型的转化
只能由高级向低级转化, 不能作相反方向的转化
连续型→有序→分类→二值(注:有方向)
离散型变量常常在适当的变换或连续性校正后,借用连续型 变量或有序变量的方法来分析
因果与联系
目的常常是探索因果关系 (causation) ,例如,危险因素与疾病首先要问有没有联系(association)?但是,联系不等于因果关系!
在解释统计分析的结果以及下结论时, 务必对“causation” 慎之又慎。