导图社区 赤裸裸的统计学
这是一个关于赤裸裸的统计学的思维导图,统计学最基本的原则之一就是一个正确抽取的样本相似于其所在的群体。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
“赤裸裸”的统计学
1.统计学在大数据时代炙手可热
描述性数据:击球率与大学学分
用抽样数据来解决大问题
概率、风险与考试作弊
统计数字背后的谎言与真相
2.描述统计学
平均数及中位数
标准差以及方差
用于衡量数据相对于平均值的分散程度
正态分布
平均值一个标准差范围(68.2%),两个标准差范围(95.4%),三个标准差范围(99.7%)
所有指数取决于其构成的描述性数据以及他们的权重,任何变化都会引起结果的改变
3.统计数字会撒谎
4.相关性与相关系数
5.概率与期望值
6.蒙提霍尔悖论
著名“三只羊”概率问题
7.黑天鹅事件
1.模型概率参建是参考的是过去的市场行为,市场行为是不可控的; 2.没有考虑“尾部事件”概率的发生。虽然概率小,但是依然会有发生的可能性。
想当然的认为事件之间不存在联系
对两个事件的统计独立一无所知
成群病例的发生
回归平均数(趋向平均数)
统计性歧视
14.项目评估与“反现实”
随机控制实验
自然实验
非对等对照实验
相比起毕业证书上的学校名字,正确认识自己的兴趣、抱负和能力更能成就人的一生。
差分类差分实验
用于分析的两个对象除了是否有介入因素,其它方面的情况应该基本上相似。
不连续分析实验
对于任何一个项目评估而言,我们都是为评价治疗或介入手段的效果提供对照组即为“反现实”
13.致命的回归错误
用回归方程式来分析非线性关系
相关关系并不等同于因果关系
因果倒置
变量遗漏偏差
高度相关的解释变量
脱离数据进行推断
数据矿(变量多)
两个基本经验:1.设计一个好的回归方程式包括考虑好有哪些变量还有数据的收集方式;2.回归分析是以观察样本为立足点,分析得出的结论需要有可复制性,可与其他的发现一致。
12.回归分析与线性关系
11.民意测验与误差幅度
样本取样能否反应整个群体的观点
问题设置是否合理,能否采集到有用信息
受访者是否诚实回答
民意测验的真正挑战: 1.设计并选取正确的样本 2.用恰当的方式从该样本中获取合适的信息, 以准确地反映他们的真实感受。
10. 统计推断与假设检验
零假设和对立假设
先提出一个零假设,然后依据数据来检验其真伪。如果得到零假设的结果概率非常低,即可推翻零假设。
9.中心极限定理
一个大型样本的正确抽样与其所代表的群体存在相似关系。
当有数量足够多的样本时,样本的平均值会以整体平均值为中心呈正态分布
样本的平均值会围绕在整体平均值附近,可以通过计算标准偏差来确认样本平均值离得“远”或者“近”。
通过中心极限定理,我们便可知道样本平均值与整体平均值之间的距离及其概率。
出现概率极低的事件时,我们可以判断是否有其他因素介入。
8.数据与偏见
选择性偏见
发表性偏见
记忆性偏见
幸存者偏见
健康用户偏见
统计分析没有错,错的是 数据样本的选择有问题
1.橄榄球的未来在哪里? 2.是什么导致了自闭症患者的激增? 3.我们依据什么来奖励优秀的教师和优质的学校? 4.解决全球贫困的最佳途径是什么? 5.猜猜你是谁?
统计学最基本的原则之一就是一个正确抽取的样本相似于其所在的群体。