导图社区 第六章 六西格玛分析
六西格玛分析阶段概述,导图给我们介绍了点估计、区间估计、假设检验、方差分析、变异源分析、拟检验合优度、列联表、非参数检验、相关分析、回归分析等方面的内容。
编辑于2022-03-22 09:23:43六西格玛分析
点估计
总体均值点估计
样本均值
当n<=2时 二者效应相等
当3<n<10时,可以可以使用中位数
当n>10时, 使用样本均值
样本中位数
总体方差点估计
样本方差是总体方差的无偏估计量
总体标准差点估计
样本标准差是总体标准差的有偏估计
Rbar/d2
当n<=2时 二者效应相等
S/c4
当3<n<30时, S/c4优于Rbar/d2
S
当n>30时无需做出修正直接使用样本标准差
区间估计
总体标准差已知
x+/- Z1-a/2*(σ/√n)
总体标准差未知且n<30
x+/-t1-a/2*(s/√n)*(n-1)
总体标准差未知且n>30
x+/- Z1-a/2*(s/√n)
总体均值已知
σ=√(∑(x-u)2/χ21-a/2)~√(∑(x-u)2/χ2a/2)
总体均值未知
σ=√((S2 (n-1))/χ21-a/2)~√((S2 (n-1))/χ2a/2)
假设检验
统计量
单正太总体均值
Z统计量
正太性
独立随机性
无离群值
统计量公式
Z=Xbar-u/σ/√n
∣Z∣>=Z1-a/2
Z>=Z1-a
Z<=Za
T统计量
正太性
独立随机性
无离群值
n<30
统计量公式
T=Xbar-u/s/√n
∣T∣>=T1-a/2*(n-1)
T>=T1-a*(n-1)
T<=Ta*(n-1)
单正太总体方差
正太性
独立随机性
无离群值
统计量公式
χ2=(n-1)*s2/σ2
χ2>=χ21-a/2(n-1) 或 χ2<=χ2a/2(n-1)
χ2>=χ21-a(n-1)
χ2<=χ2a(n-1)
双正太总体均值
统计量公式
Z统计量
Xbar-Ybar/σ/√(1/n2+1/m2)
T统计量
Xbar-Ybar/(sx2*(n-1)*sy2*(m-1)/(n+m-2))/√(1/n2+1/m2)
双正太总体方差
统计量公式
F统计量
F=Sx2/Sy2 (n-1)*(m-1)
单双比例检验
单比例检验
大样本Z=P-P0/√p*(1-p)/n
双比例检验
大样本Z=P1-P2/√p*(1-p)/(1/n+1/m)
配对T检验
配对后的数据满足正太性
配对后的数据满足独立随机性
统计量公式
T=dbar/√sd/n(n-1)
假设检验功效与样本量
n=(Z1-α+Z1-β)2*(σ/Δ)2
n、α、β成反比关系
假设检验原理
反证法
小概率事件
假设检验的步骤
建立假设
选择统计量确定拒绝域形式
确认显著性水平
一类错误
原假设成立却拒绝
二类错误
备择假设成立却拒绝或原假设不成立却接受
计算统计量
对比统计量与拒绝域临界值做出判断
方差分析
方差分析条件
正太
独立随机
各组方差相等
方差分析原理
因子组间效应与组内误差比较;如果因子组间效应>组内误差则因子效应显著
方差分析类型
单因素方差分析
SSt=SSa+SSe
F检验公式
F=MSa/MSe
MSa=SSa/dfa
MSe=SSe/dfe
自由度分解
dft=dfa+dfe
双因素方差分析
因子无交互作用
SSt=SSa+SSb+SSe
F检验公式
F=MSa/MSe
F=MSb/MSe
自由度分解公式
dft=dfa+dfb+dfe
因子存在交互作用
SSt=SSa+SSb+SSa*b+SSe
F检验公式
F=MSa/MSe
F=MSb/MSe
F=MSa*b/MSe
自由度分解公式
dft=dfa+dfb+dfa*b+dfe
变异源分析
变异类型
产品内变异
不做为因子,视为随机误差
产品间变异
做为因子
因子各个水平的平均值与因子的总平均值之差为该因子效应
时间变异
因子效应关系
交叉
与随机效应存在交互作用
例如: Y=A+B+C+A*B+A*C+B*C+A*B*C
嵌套
不存在交互作用
例如: Y=A+B(A)+C(A B) 或Y=A+B(A)+C+A*C
固定效应
随机效应
存在方差分量
拟检验合优度
χ2=∑(oi-oe)2/oe
列联表
χ2=∑(Pi-Pe)2/Pe
Pe=行和*列和/总数
非参数检验
符号检验
n<30
方法1:使用二项分布分别求出随机变量的概率;然后根据显著性水平取拒绝域
方法2: 查表 Sa: min(n-,n+)<=S拒绝原假设
n>30
近似正太Z
均值=0.5n
方差=0.25n
MWW检验
数据满足独立随机性即可
可以检验双总体是否相同的问题
利用秩和进行查表检验
Mood中位数检验
检验双总体是否相同
将两个样本数据进行排秩,然后找到中位数;分别计算n-和n+然后查表
Wilcoxon符号秩和检验
检验单总体是否相同或配对总体相同问题
克鲁斯卡尔-沃利斯检验
检验多总体是否相同问题
非参数检验数据类型需要定距或定比数据;除非定序数据精度很高
相关分析
相关系数r越接近+/-1 说明数据越关且成线性相关;
如果r为0不能说两组数据没有关系,只能说非线性关系
相关系数r与样本量有关
回归分析
一元线性回归
Y=b+b1X+error
计算Sxy/Sx求出斜率
利用最小二乘法通过X、Y的平均值(xbar,Ybar) 带入模型求出截距后可以求出拟合模型
R-square/R-square(adjust)
R-square=SSr/SSt=1-(SSe/SSt)
R-square(adjust)=1-((SSe/(n-1-P))/(SSt/(n-1)))
回归方程显著性检验
斜率检验
F检验
F=SSr/SSe=1-(SSe/SSt)
F>F1-a(dfr,dfe)
相关系数检验
回归模型残差诊断
残差与观测值顺序
正常
残差应与观测值顺序横轴0坐标上下随机波动
不正常
残差在0轴连续上升或下降或交替上升下降;说明残差自相关或有其他数据混入其中
残差与拟合值
正常
残差应该在0轴附近程带状分布
不正常
残差程喇叭口,说明拟合不好需要对Y进行转换
残差程U字形说明拟合不好需要对Y进行高阶转换
残差应符合正太分布
残差性质
残差均值期望为0
各个自变量处的残差方差相等,具有方差齐性
方差服从正太分布
方差具有独立随机性
线性回归多元
Y=b+b1X1+b2X2+error
逻辑回归