多元线性回归方程:y=a1*1+a2*2+......aN*N+b
每个自变量影响程度不同,体现在方程里就是系数大小不同,
每个系数也可以标号,b1,b2,b3,以此类推。
用案例,在实际应用中学习多元线性回归:
假设我们在市中心经营一家冷饮店。天气预报显示下周会出现寒流,气温下降,周平均温度不过25摄氏度,我们担心会对冷饮店的生意有影响,准备下周保持55折的折扣力度。需要估算出,在气温25度、折扣力度55折的情况下,我们每日的业绩大概是多少。
第二步,相关分析检验与筛选
得到数据后,首先进行基本的相关分析,确定每个自变量与因变量是否相关,如果相关,就纳入回归分析的方程,如果不相关,就删除。
计算结果如下:
气温和业绩的相关系数R1=0.8715
折扣力度和业绩的相关系数R2=-0.8122
喇叭吆喝和业绩的相关系数R3=-0.2249
可以发现,有没有吆喝跟业绩相关性不大,所以删除这组数据,只把气温*1和折扣力度*2纳入多元回归方程里。
第三步,列出初始方程:y=a1*1+a2*2+b
使用Excel求解多元线性回归方程,用LINEST函数就可以。
步骤如下:在数据分析一栏中选择”回归“
将每日业绩值输入Y值,气温和折扣力度输入X值,置信度默认90%,点击确定
最后我们可以得到这组多元回归的系数,分别为109.4687*1和-1626.8343*2和3272.2850,得到最终的回归方程为y=109.4687*1-1626.8343*2+3272.2850
但是,现实生活不是数学,随机因素影响着数据的稳定性。因此,在得出回归方程之后,我们还必须经过工具验证,来确认方程是否可信。这最后一步,就是显著性检验。
第四步,显著性检验:
需要验证方程的显著性系数F。F小于0.05,说明这组方程足够显著,可以使用。
在前面Excel求解方程式的过程中,已经有这个系数了,如图:
F=0.001167,远远小于0.05,可以证明这个方程是十分显著的
最后一步,就可以结合具体问题,开始预测了。
比如天气报下周开始降温,周平均温度只有25度,下周折扣力度为5.5折,通过方程,计算可知:下周日业绩为5114元。