一、 总体与样本(population and sample)
二、 参数与统计量(parameter and statistics)
三、 概率与频率(probability and frequency)
概率
定义
概率(P)是用来反应某一事物发生可能性大小的一种量度
频率
定义
我们进行了N次试验,其中一个事件出现的次数m与总的实验次数N的比值
进一步理解两者的关系
频率是针对过去的→针对已经发生的样本的→就像是样本统计量
概率是针对未来的→针对尚不知晓的总体的→就像是总体参数
四、 误差(error)
根据产生原因分成四种
系统误差(systematic error)
定义
试剂未校正或仪器没有调零等因素→研究结果倾向性增大或减小
抽样误差(sampling error)
为什么存在抽样误差
科学研究的目标事件是不均匀分布的
不像舀一勺老母鸡汤尝尝咸淡,像是放进去盐而没有搅匀的状态
五、 同质与变异(homogeneity and variation)
这对概念对研究统计的意义
如果没有同质
就没有我们研究的总体或样本,我们不能把他们放在一起研究
六、 随机化原则(random principle)
定义
我们在选择受试对象、受试对象分组以及对受试对象施加不同的干预措施时,受试对象被抽到的概率、受试对象被随机分到各组的概率以及受试对象接受不同干预措施的概率是相等的
三种随机化的模式
随机化抽样
从研究总体中抽取样本,总体中任何一个个体被抽到的概率相等
随机化分组
获取研究样本后,每个受试对象均有相同的机会被分到各个研究组中去
随机化顺序
我们进行交叉试验时,随机分组后的研究组接受不同干预措施的顺序是随机的
七、 因素与水平(factor and level)
八、 变量
根据变量特征的属性分类
计量变量
表现形式
通常以阿拉伯数字呈现,具有单位,可以定量比较,支持加减法运算
举例
身高(cm)、体重(kg)、血压(mmHg)···
计数变量
举例
血型(A、B、AB、O)、性别(男、女)、生肖、民族
等级变量
举例
病情(轻、中、重)、职称(初级、中级、高级)、学历(文盲、小学、初中、高中、本科)
特点
这类变量各水平之间互不相容,但又有级别上的轻重关系
变量之间的转换
举例
生活例子
院长可以去当主任,可以当小医生,但是小医生不是想去当院长就能去当的
医学例子
收缩压180mmHg(计量变量)→高血压、正常、低血压(等级变量)→正常、异常(计数变量)