导图社区 社会统计学思维导图
这是一个关于社会统计学思维导图,社会统计学是一门应用分支,它从系统地搜集、整理、分析、呈现社会环境中人类行为的数据资料,显现资料的性质。
编辑于2023-11-08 18:00:28两个总体分布一致性的检验
两个相关样本的检验
对一组个体进 行前后两次相 同的测量所获 得的两组数据
参数检验:t检验 计算检验统计量t/Z,依据小概率原理
对于小样本而言,前提条件:总体都要服从正态分布
非参数检验
符号检验,符号秩检验 (统计思想,如果总体中前后测没有变化, 那么两个样本的差异主要来源于随机误差, 为随机产生的,因此n+=n-,正秩和=负秩和) 通过比较两次测量的分布状况的一致性来达到检验目的。 检验统建量:T=min(T+, 丨T-丨)
两个独立样本的检验
参数检验
t检验 用两个样本的特征值的差来 检验两个总体特征值的差
1.借助均值 (研究变量为尺度变量))
两个总体均值差的检验 大样本——检验统计量:Z 小样本——检验统计量:t (两个总体要服从正态分布)且等方差
两个总体等方差性检验的方法: 检验统计量:F=Sa²/Sb²~F(na-1,nb-1) 前提:总体服从正态分布 在计算F统计量时,永远将Sa²和Sb²中较大的一个放在分子上
2.借助频率 (研究变量为类别变量))
用两个样本频率差检验两个总体频率差的方法
非参数检验
统计思想:两个总体分布相同, 样本分布也不会有太大的差异, 混合排秩后,两个样本的结果 会交替出现,因此便会有游程, 秩和也不会过大或过小
秩和检验
检验统计量:T(秩和)
游程检验
检验统计量:r(游程数)
累计频率检验
社会统计
基础
概率与随机变量的概率分布
古典概型,概率加法公式,乘法公式,条件概率
加法:1.A与B相容:P(A+B)=p(A)+p(B)-P(AB) 2.A与B不相容::P(A+B)=p(A)+p(B) 乘法:AB相互独立:P(AB)=P(A)·P(B) 条件概率:A与B相互不独立 P(B/A)=P(AB)/P(A) P(A/B)=P(AB)/P(B) A与B相互独立:P(B/A)=P(B);P(A/B)=P(A)
离散型随机变量的概率分布
集中趋势与离散趋势 E(X)=Σxipi D(X)=Σ[xi-E(X)]²pi
两点分布,二项分布, 超几何分布,泊松分布
泊松分布,用于描述单位时间(也可以是单位面积) 内随机事件发生的次数的概率分布
连续性随机变量的概率分布
正态分布,标准正态分布 z分数,卡方分布,t分布
大数定律、中心极限定理与抽样分布
大数定律: ①当n足够大时,频率≈概率 ② 当n足够大时,样本均值能用来估计总体均值μ
中心极限定理: n足够大,所有样本组合的均值构成正态分布 正态分布均值为μ,方差为σ²/n。
样本均值的抽样分布
样本频率的抽样分布
P~N(π,π(1-π)/n) P-π/√P(1-P)/n~N(0,1)
样本方差的抽样分布
参数估计
点估计
通过样本观察值计算出的 样本特征值来估计未知总 体的特征值
区间估计
假设检验的基本原理
依据小概率原理
使用X拔统计量
使用z统计量
使用p值
假设检验两类错误
弃真错误
原假设是正确的, 检验的结果却否定了 原假设
纳伪错误
原假设是错误的,却肯定了原假设。 纳伪概率的大小与原假设和真实总体的接近程度有关。 ·β=P(x1≤X拔≤x2)=P(z2≤Z≤z2) ·在z分数化时,均值要用真实总体的均值。z1=(x1-μ1)/s/√n ☆:在总体均值未知的情况下纳伪概率无法计算。
概率论基础➕推论统计基础
单个总体分布特征的检验
通过样本数据来检验总体是否服从正态分布 可以分为两大类: 一:在方差分析之前先用非参数检验的方法检验总体是否服从正态分布 二:通过比较两个或多个样本的分布特征来确定两个或多个总体的分布是否有差异
为参数检验验证使用条件 是否成立
类别变量分布特征的检验
卡方检验
H0:πi=πi0 H1:πi≠πi0 πi0,是根据要检验的分布 特征计算的总体各类别的 频率,从而求期望频次, 求检验统计量
尺度变量分布特征的检验
在进行两个样本的t检验, 方差分析以及回归分析的 前提都是总体服从正态分布
H0:X~N(x拔,s²) H1:总体不服从正态分布 计算样本累计频率与期望 分布函数差的绝对值的最 大值,D。与Dα比较
PS: 1.两个类别变量的关系极其假设检验 2.两个尺度变量的关系极其假设检验
两个类别变量的关系以及检验
列联相关系数
基于消减误差的比例方法构建 可作为测量两变量之间关系的 密切程度的指标
λ系数 λ=(E1-E2)/E1
τ系数 (对E1,E2定义更精确)
等级相关系数
斯皮尔曼等级相关系数
Gamma等级相关系数
肯德尔τ系数
Somer's d系数
假设检验
卡方检验
频率的条件分布等于边缘分布,两个变量互相独立条件 Pi*≈pi*(边缘分布)=ni*/n P*j≈p*j=n*j/n 条件分布:nij/n*j H0: Pij=Pi*P*j H1: Pij≠Pi*P*j 计算期望频次Eij Eij/n*j=ni*/n Eij=ni*×n*j/n(Eij不能过小要≥5) 比较期望频次与实际频次的差异,检验统计量为卡方值 Χ²可以用来度量两个变量之间的相关强度
列联相关系数的检验 (Φ系数,V系数)
斯皮尔曼等级相关系数的检验
Gamma等级相关系数的检验
τc系数与d系数的检验
两个尺度变量的关系以及检验
r(相关系数)
R拟合优度 R²=r²
F检验(线性回归方程的整体检验)
用样本的回归方程来说明总体中两个变量之间是否存在线性关系
t检验(回归系数的检验)
e(正态性,方差齐性,均值=0)
类别变量与尺度变量的关系 以及假设检验
参数检验
1.平均值比较
比较类别变量取不同值时,尺度变量的平均值是否有差异,如果有差异,则证明相关
2.统计表、条形图与折线图
3.eta(相关比率)
基于消减误差的思想构建
假设检验——一元方差分析
检验统计量,F=BSS/(m-1)/WSS/(n–m) H0: μ1=μ2=μ3=···μm H1:至少有一个类别对应的尺度变量的均 值与其他类别不相等
等方差性 正态性
多个总体分布一致性的检验
多个独立样本的检验 (分析一个尺度变量与一个 类别变量之间的关系)
非参数检验
单向方差秩分析
设被分析的尺度变量为y,类别变量为x, x共有k个取值,据此将个体分为k类,可以将其视为k个总体,从k个总体,随机抽取k个样本,将样本观察值混合排秩,如果k个总体分布一致(x与y无关),则则每个样本的秩和应该差不多大 H0:k个总体具有相同的分布 H1:k个总体具有不同的分布
检验统计量:H H服从自由度为k-1的卡方分布
中位数检验
将所有观测值混合排序找出中位数,k个总体若分布相同,则总体中每个类别中小于等于中位数和大于中位数的个体数应基本相等。 1.计算小于等于中位数,和大于中位数的频率 2.计算期望频次分布 3.检验统计量为卡方值,代入数据计算
多个相关样本的检验
双向方差秩分析
两种情况:一是对一个随机样本进行了多次内容相同的测量,这多次测量的结果形成了多个相关样本
kendall'sW检验