导图社区 数据分析之回归分析
简要概述回归分析的定义、种类(线性回归、非线性回归)、作用以及回归分析与相关分析的区别。
对比什么数据(4大来源),怎么对比(五类),和谁对比(三个维度)。简单来说,就是为达到某一个目标,制定两个版本,A版本和B版本。这两个版本只有某个元素不一样,其他元素都一样。我们让一部分用户使用A版本,一部分用户使用B版本,A版本为实验组,B版本为对照组。两个版本运行一段时间后,分别统计两组用户的表现,然后对两组数据进行对比分析,选择能达成目标的版本,正式发布给全部用户。
社区模板帮助中心,点此进入>>
互联网9大思维
安全教育的重要性
组织架构-单商户商城webAPP 思维导图。
个人日常活动安排思维导图
域控上线
西游记主要人物性格分析
17种头脑风暴法
python思维导图
css
CSS
数据分析之回归分析
定义
第一,它涉及到两个及以上变量之间的关系。比如肩宽和身高,或者肩宽、体重和身高。
第二,这组关系可以用一个明确的方程来表示。线性回归分析的重点,就是通过工具计算找出方程,找出方程才能根据一个变量进行另一个变量的测算。
第三,回归方程可以用来对其中一个变量(因变量)进行预测。比如我们前面提到的,通过对身高数据的调用,来推测肩宽。
回归分析的种类
线性回归
自变量与因变量之间的关系,在散点图中可以用一条直线拟合。
按照自变量的多少可分为
一元线性回归
常常需要通过操纵一个变量的数字,去估算和预测另一个变量的数字
比如打车费可以通过路程来估算
分析四步骤
1、确定自变量和因变量
2、绘制散点图
3、求方程
任何线性相关的两组数据,都可以用方程表示出来。
公式y=ax+b
方法
1、Excel绘制散点图,2、Excel求解一元线性回归方程:在添加趋势线的同时,进入趋势线选项,选择勾选“显示公式”和“显示R平方值”,就可以自动显示了。
4、验证方程是否准确
R方最大是1,越接近1,说明这组方程越准确。
一元线性回归,在这种变量确定的问题中,能够快速确认变量关系,从而进行简单的预测和控制。
多元线性回归
一个自变量对一个因变量就是一元,多个自变量对一个因变量,就是多元。
方程
每个自变量影响程度不同,体现在方程里就是系数大小不同,每个系数也可以标号b1,b2,b3,以此类推。
y=a1*1+a2*2+......aN*N+b
分析的四大步骤
1、用Excel整理和拉取数据
凭借对问题所在领域的经验感知,找出我们初步认为与问题相关的自变量,抓取并统计数据
2、相关分析检验与筛选
确定多个自变量与因变量的相关关系,删除无关变量。
目的是理清问题的分析逻辑,确定要参与回归分析的自变量有哪些。
3、列出初始方程
用LINES函数求解多元回归方程,这一步,我们初步确定了多个自变量和因变量之间的关系。
4、显著性检验
为了排除数据统计观测过程里的随机干扰,,我们必须经过显著性检测。
需要验证方程的显著性系数F。F小于0.05,就说明方程足够显著,可以使用。
非线性回归
自变量与因变量之间的关系,需要使用曲线来拟合。
回归分析的作用
第一种,回归分析可以帮助我们做预测
第二种,回归分析可以帮助我们做决策
回归分析与相关分析的区别
自变量与因变量
我们要计算的变量叫做因变量;我们用来计算和推算的变量,叫做自变量
相关分析中两组变量的地位是平等的,是看互相之间的关系。
回归分析是看一个变量调整后,如何根据精确的量化关系,来计算出另一个变量。
在相关分析中,相关不代表因果。
在回归分析中,自变量是因变量的原因,但因变量和自变量之间并没有因果关系。