导图社区 数据分析思维工具-相关分析
在工作中,我们可以用对比分析定位问题,用拆解分析将复杂问题简单化,找到小的切入点。 但是,针对同一个问题,有时候能找到多个小的切入点。 所以,我们要进一步学习相关分析,用数据去判断这些影响因素是否与最终的结果相关,以及相关密切程度高低,据此判断工作的优先级。
提起“唐宋八大家”之一的欧阳修,你知道的肯定是他诗文写得好。但有件事你八成不知道,他曾经主张过焚毁书籍。这就有点奇怪了,身为儒家士大夫,秦始皇焚书坑儒被骂了千年的事肯定是知道的,欧阳修怎么敢提出焚书的主意呢?
一提到欧洲中世纪,很多人都觉得那是个黑暗时代。还会下意识认为,这黑暗是罗马教会造成的。可事实是,在西罗马帝国崩溃后的漫长黑暗乱世里,罗马教会却成了保留亮光的地方。比如招兵买马跟蛮族人干,拿出财产解决罗马城的粮食短缺问题,甚至有权力的人也愿意保护他们。这就怪了,在我们一般印象里制造黑暗的罗马教会,怎么反倒成了黑暗中的那点 “亮光” 呢?
053年,辽朝皇帝跟大宋提出,想要一张宋仁宗的画像来看看。但大宋根本没接这个茬。往后几年,辽朝皇帝三番五次想要仁宗的画像,但大宋却推三阻四,犹犹豫豫。你会不会觉得有点奇怪?不就是一张画像的事儿吗?在我们今天的人看来,人家找你要一张画像,这就像粉丝找明星要一张签名照片,这不是联系感情的好办法吗?宋仁宗为什么就是不给呢?
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
相关分析法:验证切入点,迅速判断工作优先级
来源:圈外数据学院L1
什么是相关
相关,其实就是指两个变量,当一个变量发生变化时,另一个变量也跟着变化的关系。比如:体重随身高变化而变化,销售量随价格变化而变化。
什么是相关分析
相关分析,就是去找到两种变量中间,到底有什么相关关系,是正相关,还是负相关,还是指数相关,或者是其他相关,等等。也就是说,A因素变了之后,B因素是怎么跟着变的。
相关分析三大应用场景
1、快速锁定大问题相关的小因素,优化资源配置
2、用数据说服他人,终结撕逼
3、帮我们判断事情的优先级
相关关系
线性相关
正线性相关
负线性相关
非线性相关
1、指数相关
2、对数相关
当Y轴的数值,整体上随着X轴数值的增高而增高,且呈接近直线的分布时,两组变量为正线性相关。
当Y轴的数值,整体上随着X轴数值的增高而降低,且呈接近直线的分布时,两组变量为铜线性相关。
比如,”裙摆指数“,就是经济越好的时候,女生的裤子长度越短,这就是负相关。
指数相关
就是指一个变量,以固定的比率变化, 变化趋势越来越明显。
比如,一个人的工资和职级,基本是指数关系,比如原来工资是1尤,按照20%的比例涨薪,就涨到了12000。下一次升职,再按20%涨薪,就涨到了14400。你会发现,第一年涨薪绝对值是2000,第二年则提升到了2400,出现了指数型的增长。
再比如,常常讲的复利,就是指过去的利息也产生了利息,这个就是指数级的增长。
”量变达到质变“:比如,一件事情启动,在相当长的一段时间内,几乎没有任何能让外我看出来的进步。直到某个时候,一下子显现出来,越增长越快。这就是一个指数递增关系。
1.01的365次方=37.78343433289,0.99的365次方=0.2551796445229,这是指数的规律。
对数相关
对数相关和指数相关,正好是相反的关系。如果指数变化是先慢后快,那么对数变化就是先快后慢,后期逐渐进入平台期。
比如,健身,在一开始时,常常感到身心愉快,进步神速,但越到后面,就越发现每天的训练好像进入平台期。
再比如学习,一开始从60分提升到80分,比后期从90分提升95分,要简单、快速得多。
相关分析怎么做
相关分析用Execl、Python、SPSS都可以做。不过用哪个工具不重要,都能给你结论。
案例:一家公司内部,某个工程师岗位的月薪与工作该岗位工作年限之间的相关分析。
1、我们选择这些数据放入Excel,做成散点图
在散点图上选择”添加趋势线“,就得到:
在Excel里面,可以选择”显示相关系数“。
直接通过Execl找到这条直线趋势线的公式:y=3934.4x+8463.9,x是横轴,代表工作年限,y是纵轴,代表月工资收入。
得到公式后,我们就可以进行预测:假设工作年限x=1.5,代入公式y=3934.4x+8463.9,得到对应的y=14365.5元。
数据预测是”相关分析“的进一步
我们常说的”大数据“,也是基于不同变量之间的关联性来进行分析和应用的。
2009年,谷歌公司就利用数据成功预测了美国冬季流感的传播趋势,甚至可以定位到具体的区域和所在州。
注意事项
两个变量存在的相关关系,并不一定代表这两个变量存在因果关系。相关并不代表因果。
当我们在做相关分析时,如果从数据上发现两个变量是相关的,还要额外注意,是不是还有一个另外的其他变量在影响着我们的分析结果。相关分析只是一种数据分析方法,最终的结论,还需要我们结合对业务的理解来判断。