导图社区 《逻辑思维训练50讲》第8部分 统计的方法
这是吴军老师《逻辑思维训练50讲》的第八部分,这部分主要讲述了归纳与演绎推理及统计数据的方法及运用。
编辑于2024-12-24 15:02:21这是陈欢老师《单干》一书的第五章,这一章主要讲了: ①河流模型 ②难而正确 ③做出选择就是进展 ④长期主义 ⑤先胜后战 ⑥投资于人 ⑦设好边界 ⑧小心暗礁。
这是一篇关于抗战胜利80周年纪念日的知识概览的思维导图,主要讲了和纪念日有关的三个重要日期,以及选取的立场和标准。
这是粥左罗老师《语音写作》一书的第三章:能力基建,这一篇主要讲了以下内容: ①心里突破:大脑为何抵触语音写作 ②朗读训练:从碎片表达到逻辑流输出 ③准确性训练:99%识别准确率的秘密工程 ④极速训练:让语速追上思维闪电 ⑤自信训练:从自我怀疑到创作心流。
社区模板帮助中心,点此进入>>
这是陈欢老师《单干》一书的第五章,这一章主要讲了: ①河流模型 ②难而正确 ③做出选择就是进展 ④长期主义 ⑤先胜后战 ⑥投资于人 ⑦设好边界 ⑧小心暗礁。
这是一篇关于抗战胜利80周年纪念日的知识概览的思维导图,主要讲了和纪念日有关的三个重要日期,以及选取的立场和标准。
这是粥左罗老师《语音写作》一书的第三章:能力基建,这一篇主要讲了以下内容: ①心里突破:大脑为何抵触语音写作 ②朗读训练:从碎片表达到逻辑流输出 ③准确性训练:99%识别准确率的秘密工程 ④极速训练:让语速追上思维闪电 ⑤自信训练:从自我怀疑到创作心流。
《逻辑思维训练50讲》
第27讲
统计的方法
作者 | 吴军
制图 | Amor小凯
软件 | 亿图脑图MindMaster
日期 | 2024年10月6日
概述:如何正确使用归纳的方法?
归纳推理和演绎推理的区别
演绎推理
演绎推理所得到的结论,通常是对于一类事物的整体结论,这个结论对所有这一类事物都适用,没有例外
演绎推理中,结论蕴含在前提之中
归纳推理
归纳推理的本质是从一个个具体的案例和样本中找出共性,总结经验,从而得出合理的结论
对于根据归纳推理得到的结论,我们需要更谨慎
两种推理方式的最大区别
演绎推理的结论对于前提内的所有情况都适用
归纳推理得出的结论绝大部分都会有例外
三个使用归纳推理的前提
条件1——研究的对象间具有相关性
条件2——选定合理的参照系(比较对象)
条件3——有足够多的数据
XXX
《逻辑思维训练50讲》
第28讲
统计的方法
作者 | 吴军
制图 | Amor小凯
软件 | 亿图脑图MindMaster
日期 | 2024年10月7日
基础:数据在统计中的作用有多大?
数据的概念
统计学中数据的概念
统计学中的数据,不等同于我们通常说的数字,而是关于特定对象的定性或定量的描述
误区纠正
数据中不一定都含有信息
信息一定是某种形式的数据
信息是加工过后的数据
解读
很多人强调要“看数据”,其实看的是数据背后隐藏的信息
数据分类
量化数据
数字、收入、圆周率……
非可量化数据
图片、文字、声音、指纹……
但可以通过编码的方式进行量化
有些信息强行量化就会产生信息损失
书法作品
变量是什么
变量
数学上
变量是针对常数而言的,强调变化
统计上
变量强调个体的某个特征
可以被理解为个体的一个量化属性
可以被理解为个体的一个侧面
科学对待
要明确自己进行归纳推理、分析问题的目标是什么
利用数据得出的结论,更好地指导自己的工作生活,而不是和他人争论
数据的重要性
数据重要性
它是所有归纳方法的基础
使用数据的四个步骤
步骤1
收集我们所需要的数据
步骤2
通过处理和挖掘数据,寻找规律
步骤3
通过挖掘不同维度数据之间的相关性,看看能否通过某些已知的或者容易获取的数据,去了解未知的或者难以获取的数据
步骤4
在数据分析的基础上,建立一个和观察数据相符合的数学模型
通常认为: 数据分析的最高境界,就是找到这种规律,并建立起相应的数学模型
XXX
《逻辑思维训练50讲》
第29讲
统计的方法
作者 | 吴军
制图 | Amor小凯
软件 | 亿图脑图MindMaster
日期 | 2024年10月8日
分析:如何通过分析数据得到信息?
一元变量的数据
常见案例
每天上下班所花费的时间
一群人智商的分布
一个班里同学们的身高
如何呈现
可以通过统计图来直观地表现数据的分布
更多变量的数据
常见案例
分析一个班上同学的身高和体重
山的高度与气压之间的关系
变量间关系
相关性
一个变量的变化可能会影响另一个变量的变化
决定性
一个变量的变化必然引起另一个变量的变化
因果关系
一个变量变化必导致另一变量变化,且前者是后者变化的唯一因素
总结
面对两个可能存在关联的事情,首先判断一下这些变量是否真的有关系,如果是强行凑在一起的,分析得出的结论自然不太具备参考性
SPDC方法
SPDC概念
S
state(陈述)
P
plan(计划)
D
do(行动)
C
conclude(总结)
一套完整的解决问题的步骤
SPDC解读
state(陈述)
思考你要解决什么问题?
plan(计划)
你计划如何解决问题,需要什么数据和统计工具?
do(行动)
基于收集得来的数据
画统计图得到直观印象
计算得到一些统计学指标
conclude(总结)
通过数据得到结论
XXX
《逻辑思维训练50讲》
第30讲
统计的方法
作者 | 吴军
制图 | Amor小凯
软件 | 亿图脑图MindMaster
日期 | 2024年10月9日
图形工具:如何对数据产生直观感觉?
点图的应用
举例
设某个班级成绩如下
82, 87, 77, 95, 93, 68, 94, 89, 91, 100, 62, 79, 85, 89, 92, 78, 93, 90, 88, 86, 62, 96, 87, 82
制作点图
结论
大部分学生的成绩在86-95分之间
但是,有3个学生的成绩和大部分同学相差较大
总的来讲,成绩的分布是中间高、两头低
学生成绩的分布不对称,低分的学生拖了较大的后腿
量化的指标
常用指标
最大值
最小值
均值
平均数,是指一组数据加起来除以数量的个数,得到的值
中值
也叫中位数
指一组数据按大小排序后,处在中间位置的那一个值
在绝大部分情况下,中值比均值更有意义
幅度
也被称为宽度,就是最大值和最小值的差异
常见情况
存在极端值
与总体数据差距过大
举例
很多比赛打分,都会有一个“去掉最高分和最低分”,就是为了消除极端数值的影响
比较平均
正态分布
等可能事件的概率问题
XXX
《逻辑思维训练50讲》
第31讲
统计的方法
作者 | 吴军
制图 | Amor小凯
软件 | 亿图脑图MindMaster
日期 | 2024年10月10日
应用:如何用数据指导生活?
如何系统性解决问题?
总结
比起原地打转,更应该做的,其实是对自己的过往经历做一次数据统计
四分位数的应用
概念
把按大小排序的一组数据划分为四个相等的部分
排序在1/4位置的数据,叫做第一个四分位数,统计中用Q1表示
排序在2/4位置的数据,叫做第二个四分位数,统计中用Q2表示
排序在3/4位置的数据,叫做第三个四分位数,统计中用Q3表示
上述三个数据再加上最小值、最大值,一共有五个点
解读
这五个点,特别是Q1和Q3的数据,大致能反应出数据分布的规律
引申概念IQR
四分位数范围IQR
Interquartile Range
又叫四分位距,它指的是Q3减去Q1的差值
一般情况下,给IQR乘上系数1.5来判断稳妥性
公式
IQR=Q3–Q1
离群值
>Q3+IQR×1.5
<Q1-IQR×1.5
离群值的应用
以通勤时间为例,因为通勤时间越短越好,所以要尽可能低,关注最高值的情况是否能接受 (下图中,横坐标为通勤时间min,纵坐标为频率)
方案1
路线
走高速+进市区
Q1=35,Q3=50,IQR=Q3-Q1=15 则IQR=50+15×1.5=72.5
方案1需要预留72.5分钟
方案2
路线
全程走高速
Q1=40,Q3=45,IQR=Q3-Q1=5 则IQR=45+5×1.5=52.5
方案2需要预留52.5分钟
所以,方案一需要预留的时间更长,方案二更合适
XXX