导图社区 基本原理与方法
基本原理与方法;统计概述:汇总群体数据,计算并发现其中规律的一门学科 ,处理数据中的变异性,从变异的看似杂乱的数据中新发现必然规律或征象
“DNA是由四种碱基按互补配对原则(即腺嘌呤A对胸腺 嘧啶T,鸟嘌呤G对胞嘧啶C)组成的螺旋双链。在细胞内,DNA复制时, 解螺旋酶首先解开双链让它变成单链做为模板,然后,另一种酶--RNA聚 合酶合成一小段引物(primer)结合到DNA模板上,最后,DNA合 成酶以这段引物为起点,合成与DNA模板配对的新链。PCR即是在体外模 拟DNA复制的过程
社区模板帮助中心,点此进入>>
项目时间管理6大步骤
项目管理的五个步骤
电商部人员工作结构
暮尚正常运转导图
产品经理如何做好项目管理
车队管理
创业者10条创业经
创业十大思维误区
管培生课程作业
商业模型
基本原理与方法
统计概述
汇总群体数据,计算并发现其中规律的一门学科
处理数据中的变异性,从变异的看似杂乱的数据中新发现必然规律或征象
抽样研究
通过样本信息推断总体特征,在考虑抽样误差的情况下有理有据的猜测总体
总体--用参数描述 常用希腊字母表示,是固定的,未知的
样本--用统计量描述 常用拉丁字母表示,可测量,接近于总体但不同
数据分布与描述
定量数据
数据分布
对称分布
均匀分布
以最大值和最小值的中间为界限,左右大致对称分布
正态分布
X~N(μ,Sigma的平方 )
对称性
集中性
标准正态分布
X -N(0,1)
任意正态分布可通过换元转化为标准正态分布 利用Z值求出以原始变量X相关的概率值
应用
可通过标准状正态转换计算观察是否是小概率事件
制定医学参考值范围
利用小概率事件原理进行统计推断
不对称分布
偏态分布
包括正偏态和负偏态,常表示异常数值
心中趋势用中位数M 离散趋势用四分位间距Q表示
统计描述
集中趋势
算术平均数X
总体均数μ 样本均数X把
X不等于μ,各样本均数存在差异
样本均数分布为中间多两边少左右基本对称 样本均数变异范围较原变量变异范围大大缩小
适用于对称分布,近对称分布,尤其适用于正态分布,但对异常值 比较敏感
中位数M
适用于表示明显偏态分布数据的集中趋势,一边或两边存在不确定数值分布情况不确定
众数 几何均数。。。
离散趋势
方差和标准差
总体方差 标准差
样本方差 标准差
四分位数间距 Q
Q越大,变异程度越大
是用于表示明显偏态分布数据的离散趋势
极差 变异系数
定性和等级数据
绝对数(个数)
相对数
率(二分类)---频率 强度 百分率 千分率
构成比( 二分 多分 )
统计推断原理
抽样误差和标准误
样本均数的离散程度
样本均数的变异是抽样误差造成的
可通过增加样本量n来降低抽样误差
参数估计
点估计
未考虑抽样误差
区间估计
置信区间(1-α)
总体率95%置信区间最常用
假设检验
1.建立假设检验确定检验水准
1)零假设H0
2)备择假设H1
3)检验水准α,常取α=0.05
2.计算检验统计量-不同的检验统计量意味着不同的检验假设方法
3.计算P值,下结论
a.当P小于等于0.05时,按照检验标准α,拒绝H0,接受H1,可认为总体参数差异具有统计学意义
b.当P大于0.050,按照检验标准α,不拒绝H0,可以认为总体参数差异不具有统计学意义
P值:H0成立的概率,P值越小,拒绝H0接受H1可能性越大,信心越足,可靠性越强
统计方法选择
差异性比较,探讨2或多个总体参数是否具有统计学差异
t检验
F检验(方差分析)
卡方检验
秩和检验
LogRanK分析
关联性比较,探讨2或多个变量之间是否有统计学关联
线性相关分析
秩相关分析
线性回归分析
logistic回归分析
coxbl风险模型