导图社区 统计实务
专业培养目标:培养掌握现代企业、事业、机关单位经济统计的基本理论和基本技能,从事统计调查、统计信息管理、数据分析等工作的高级技术应用性专门人才。
社区模板帮助中心,点此进入>>
马克思主义原理
考研数学重点考点知识总结归纳!
数据结构
法理学读书笔记
思维导图带你认识马克思主义原理
建筑光学基本知识
考研英语一写作
教育学考研:教育学原理第八章教学内容整理
考研三步翻译技巧
东方文明古国的教育
统计实务
一、数据
统计数据
数值与非数值
数值型数据
非数值型数据
分类数据
顺序数据
观测与实验
观测数据
实验数据
横截面、时序与面板
横截面数据
同个时间的数据,例:2022年各省GDP数据
时间序列数据
不同时间点的一系列数据。例:浙江省历年GDP数据
面板数据
不同对象 在不同时间数据。例;2010-2020全国各省GDP数据
数据的收集方法
5W1H
who-1、who-2、when、where、what、how
调查方案程序
调查目的和任务、调查对象和调查单位、调查方式、调查研究的内容、调查时间、调查工作的组织实施计划等内容。
常用的统计调查方式
普查
抽样调查
优点
经济性优、时效性强、适应面广、准确性高
抽样方法
概率抽样
等概率抽样
简单随机抽样
从总体N中抽 n 个样本
分层抽样
总体N分成不同的层/组,再按比例从每层中抽取样本
整群抽样
总体N分成不同R个群,从R中随机抽去 r 个群,再对抽中的每个群抽取样本
系统抽样
等距抽样,r、r+a、r+2a、r+3a、、、、、
非等概率抽样(P14)
方便抽样
判断抽样
配额抽样
雪球抽样
统计报表
重点调查
如:天猫 淘宝 在电商企业中的情况
典型调查
如:受有意识的选出若干个有代表性的限制
搜集数据的方法
询问(访谈))
面谈
邮寄
计算机辅助电话调查
座谈会
个别深入访谈
观察实验
观察法
在调查对象完全没有意识到的情况下调查
实验法
数据的误差
抽样误差
受抽样样本的随机性所造成的样本值与总体值之间的差异
影响误差大小因素
总体内部的差异程度
样本容量大小
抽样的方式与方法
非抽样误差
除了抽样误差外的其他原因引起的差异
不能通过增大样本量控制误差
抽样框误差
丢失目标总体单元
包含非目标总体单元
复合连接
一对多情况
不正确的辅助信息
应答误差
被调查对象给出答案与实际不符,受理解、记忆等影响
无回答误差
调查问卷有些未回答
计量误差
登记错误、数据录入有误等
二、数据描述
用统计量描述数据
反映数据分布的集中趋势
平均数
算数平均数
加权平均数
几何平均数
中位数Me
分位数
众数Mo
反映数据离散程度
异众比率
非众数组的频数占总频数的比率
比率越大,代表性越差
极差(全距))
四分位距
平均差
方差与标准差
离散系数(也称 变异系数、标准差系数)
标准分数
反映数据分布形态度量
偏态系数 SK
不对称成为偏态
SK<0,左偏分布(有极小值)
SK=0,对称分布
SK>0,右偏分布(有极大值)
峰态系数 K
尖峰或平峰
K<0 偏平分布
K=0 正常分布
K>0 尖峰分布
用图形描述数据
直方图
箱线图
茎叶图
适应未分组原始数据,小批量数据
折线图
一段时间内变动情况
气泡图
三个变量之间关系
雷达图
多个变量
散点图
两个变量
条形图
饼图
一个样本(或总体)各部分占总体比重,结构性问题研究
环形图
多个样本(或总体)之间的结构差异,结构比较研究,展示分类数据和顺序数据
帕累托图
双直角坐标系(左纵频数 右纵频数)
三、参数估计
统计量与抽样分布
统计量的抽样分布
概念:抽样分布就是统计量分布。理论上抽样中,统计量是一个随机变量。
样本均值的抽样分布
E(X把)=μ。
正态分布
重复抽样 σ²(X把)=σ²/n
不重复抽样 σ²(X把)=σ²/n *(N-n)/(N-1)
(N-n)/(N-1)为修正系数,当N较大时,n/N≥5%,修正系数为1-n/N ; 当n/N<5%,修正系数为1.
非正态分布
中心极限定理
若总体未知的非正态分布,只要样本容量n足够大(通常n≥30),样本均值仍会接近正态分布,其分布的期望值为总体均值,方差为总体方差的1/n。 (同重复抽样)
样本比例的抽样分布
E(p)=π
重复抽样 p的方差 σ²(p)=π*(1-π)/n
不重复抽样 p的方差 σ²(p)=π*(1-π)/n *(N-n)/(N-1)
(N-n)/(N-1)为修正系数, 当N较大时,n/N≥5%,修正系数为1-n/N ; 当n/N<5%,修正系数为1.
若总体未知的非正态分布,只要样本容量n足够大,样本均值仍会接近正态分布,其分布的期望值为总体均值,方差为总体方差的1/n。
当np≥5%,且n(1-p)≥5%时,样本容量足够大
统计量的标准误差
公式
总体标准差
当标准差 σ未知时,可用样本标准差 s 代替计算
总体比例的标准差
当总体比例方差 π(1-π)未知时,可用样本比例的方差 p(1-p)代替
点估计及估计量的评价标准
无偏性
有效性
一致性
区间估计
概念
在点估计的基础上,区间通常由样本统计量 加减 估计误差
估计基础
总体是否正态分布、样本是否大小样本、总体方差是否已知。
总体均值估计公式
正态
大样本(n≥30)
已知
未 知 (用s代替)
小样本(n<30)
未 知 (用t代替Z、s代替σ)
比例区间估计公式
两个总体参数区间估计
独立样本
大样本
小样本
匹配样本(两个总体均值之差的估计)
样本量的确认
四、假设检验
子主题
五、相关分析
六、回归分析
一元线性回归分析
一元指的是自变量的个数(1个)