导图社区 统计学和数据
这是一篇关于统计学和数据的思维导图,主要内容包括:统计学的含义和应用,发展简史,变量与数据,数据搜集,数据误差。
社区模板帮助中心,点此进入>>
英语词性
法理
刑法总则
【华政插班生】文学常识-先秦
【华政插班生】文学常识-秦汉
文学常识:魏晋南北朝
【华政插班生】文学常识-隋唐五代
民法分论
日语高考動詞の活用
第14章DNA的生物合成读书笔记
统计学和数据
统计学的含义和应用
含义:统计学是通过整理、分析收集来的数据,发现统计规律,解决实际问题。统计学关注大量可重复的数量特征。
基本概念
总体、元素、总体参数
样本、样本统计量、样本容量/样本量
统计方法:描述统计、推断统计
发展简史
古典统计学
国势学派:代表人德国康令
政治算术:代表人英国威廉配第,政治经济学之父,统计学创始人。
近代统计学
数理统计学派:代表人比利时凯特勒,统计学之父,古典统计学的完成者,近代统计学的先驱者
社会统计学派:德国克尼斯首创,代表人恩格尔、梅尔;
现代统计学
现代统计学派:贡献最大英国哥赛特(先驱者)、费雪(建立者)
变量与数据
变量:从一次观察到下次观察结果不同
数据
数值型和非数值型
数值型:定量数据,可运算具体大小和差异
非数值型
分类数据
顺序数据:比分类数据更具体
注意:数值型数据可以运算,计量功能大,精度大,应用最广泛 应用于数值型数据的统计方法很多不适用于非数值型,而反过来可以适用
观测和实验
观测数据:实地观测,有可能是全面数据也有可能是样本数据
实验数据:实验环境下取得,一般都是样本数据
横截面、时序、面板
横截面数据:多个对象,同一时间
某年度我国不同省市的GDP
时间序列数据:同一对象,不同时间
河北省2017-2025年的GDP
面板数据:多个对象,不同时间
我国各省市在2017-2025年的GDP
数据搜集
数据来源
原始数据:直接调查和实验
次级数据:别人调查,经加工和汇总后;
包括公开出版的、未公开出版的、网络爬取的数据
数据搜集方法
调查方案要满足5W:when who where what how
常用调查方式
普查:一次性、全面调查
抽样调查
概率抽样/随机抽样
简单随机抽样
分层抽样
整群抽样
系统抽样
非概率抽样
方便抽样
判断抽样
配额抽样
雪球抽样
统计报表
报送范围:全面报表、非全面报表
报送周期
月报、季报、年报
重点调查
典型调查
询问/访谈
面访、邮寄、计算机辅助电话调查、座谈会、个别深入访谈
观察实验
观察法和实验法
数据误差
抽样误差
取决于:1.总体内部差异大小、2.样本容量大小、3.抽样方法
非抽样误差
抽样框误差
丢失目标总体单元、包含非目标总体单元、复合连接、不正确的辅助信息
应答误差
无回答误差
计量误差