导图社区 数据分析思维工具-回归分析
相关分析,帮助我们可以找到影响产品销售的相关因素,确定各因素的相关关系。在实际工作中,这可能还不够,可能需要我们作出更加精确的判断和预测。比如,在特定的渠道、价格等因素之下,下个月、下个度度、下一年的销售额预计是多少? 要解决这类涉及预测和控制的问题,就需要学习回归分析。
编辑于2022-05-17 17:57:26公元1100年,中国历史上那位以亡国之君身份而广为人知的宋徽宗,正式登上了历史舞台。在继位之前,宋徽宗赵佶既非嫡子亦非长子,生母地位卑微且早早离世,缺乏强大的母族支持。按常理,这样的皇子在皇位继承的激烈角逐中,往往只能充当陪跑的角色。然而,命运弄人,这一年,他却意外地成为了最后的赢家。正月十一深夜,年仅25岁的宋哲宗突然驾崩,未留下子嗣、遗诏,甚至没有一句口信,大宋王朝陷入了前所未有的权力真空。这突如其来的变故,让朝廷上下措手不及,意见纷纭,难以统一。在这关键时刻,向太后站了出来,力挺端王赵佶继位。然而,这一提议却遭到了宰相章惇的坚决反对。章惇甚至直言不讳:“端王轻佻,不可以君天下。”这番话,在后人看来,无疑是对宋徽宗性格和治国能力的精准预言。但章惇的反对并未能阻挡宋徽宗继位的步伐。或许是因为向太后的坚定支持,或许是因为朝廷内部其他势力的权衡利弊,最终,赵佶还是坐上了那把至高无上的龙椅。然而,历史总是充满了讽刺。章惇虽然看透了赵佶的性格缺陷,却未能阻止他成为大宋的皇帝。而宋徽宗,这位曾经在继承之战中默默无闻的陪跑者,最终却以亡国之君的身份,永远地载入了史册。
在历史研究的广阔领域中,对特定历史事件背后深层原因的剖析一直是吸引众多历史爱好者和学者的关键。这张关于“公元1099年:西夏为什么不怕经济制裁?”的思维导图模板,为人们深入探究这一有趣的历史问题提供了清晰且系统的知识体系。你以为手握经济命脉,就能让对方跪地求饶?大宋在这件事上,天真了半个多世纪。公元1099年,西夏的小梁太后去世,宋夏正式签下新约,西夏终于被打服了!但是很少有人知道,在这场胜利之前,大宋曾陷入一个诡异的死循环:明明占尽经济优势,西夏的粮食、茶叶、布匹等物资几乎全靠宋朝供给。司马光甚至说过这么一句话:西夏就像个婴儿,宋朝一断奶,立马就活不下去。然而每一次宋朝祭出贸易制裁的大棒,不仅没有让西夏服软,反而换来更加猛烈的攻击。打仗耗不起,占地守不住,经济制裁还适得其反。大宋就这样被西夏生生折磨了半个多世纪。问题到底出在哪儿?为什么堵死一条危险的路,反而逼着对方走上另一条更危险的路?看上去最省力的办法,为什么反而把局面越推越险?对于历史爱好者来说,此模板能够帮助他们更深入地理解宋夏之间的经济与政治博弈,拓宽历史视野;历史学者可以借助该模板的结构和思路,进一步开展相关研究。
在历史文化的浩瀚海洋中,传国玉玺一直笼罩着神秘的光辉,而公元1098年关于假玉玺为何似有真魔力的探讨更是引人入胜。这张关于《公元1098年:假玉玺怎么有真魔力?》的思维导图模板,源自《文明之旅》第99期,由主讲人罗振宇呈现,为历史爱好者、文化研究者以及广大学生群体打开了一扇深入探索历史奥秘的窗口。系统梳理了传国玉玺的历史流变、政治功能与“共同知识”理论。内容涵盖传国玉玺从秦汉到明清的流传简史、1098年北宋哲宗时期咸阳百姓段义献玺事件、鉴定过程与朝堂争议,以及“假玉玺为何能产生真魔力”的深层政治逻辑。图中引入“共同知识”“预期协调”“信物效应”等概念,结合宋真宗“天书封禅”、辽朝科举命题、元朝皇位继承等历史案例,阐释政治象征物如何凝聚共识、构建合法性。适用于历史爱好者、政治学研究者、文化传播从业者、教育工作者及内容创作者,帮助理解中国古代政治运作中的符号力量与共识机制。对于历史爱好者而言,这张思维导图满足了他们对历史细节的探寻欲望,那些鲜为人知的发现过程、朝堂上的决策博弈都一一呈现。借助EdrawMind绘制的这张思维导图,将历史事件和人物关系以直观的图形展示出来,让读者能够轻松理解。
社区模板帮助中心,点此进入>>
公元1100年,中国历史上那位以亡国之君身份而广为人知的宋徽宗,正式登上了历史舞台。在继位之前,宋徽宗赵佶既非嫡子亦非长子,生母地位卑微且早早离世,缺乏强大的母族支持。按常理,这样的皇子在皇位继承的激烈角逐中,往往只能充当陪跑的角色。然而,命运弄人,这一年,他却意外地成为了最后的赢家。正月十一深夜,年仅25岁的宋哲宗突然驾崩,未留下子嗣、遗诏,甚至没有一句口信,大宋王朝陷入了前所未有的权力真空。这突如其来的变故,让朝廷上下措手不及,意见纷纭,难以统一。在这关键时刻,向太后站了出来,力挺端王赵佶继位。然而,这一提议却遭到了宰相章惇的坚决反对。章惇甚至直言不讳:“端王轻佻,不可以君天下。”这番话,在后人看来,无疑是对宋徽宗性格和治国能力的精准预言。但章惇的反对并未能阻挡宋徽宗继位的步伐。或许是因为向太后的坚定支持,或许是因为朝廷内部其他势力的权衡利弊,最终,赵佶还是坐上了那把至高无上的龙椅。然而,历史总是充满了讽刺。章惇虽然看透了赵佶的性格缺陷,却未能阻止他成为大宋的皇帝。而宋徽宗,这位曾经在继承之战中默默无闻的陪跑者,最终却以亡国之君的身份,永远地载入了史册。
在历史研究的广阔领域中,对特定历史事件背后深层原因的剖析一直是吸引众多历史爱好者和学者的关键。这张关于“公元1099年:西夏为什么不怕经济制裁?”的思维导图模板,为人们深入探究这一有趣的历史问题提供了清晰且系统的知识体系。你以为手握经济命脉,就能让对方跪地求饶?大宋在这件事上,天真了半个多世纪。公元1099年,西夏的小梁太后去世,宋夏正式签下新约,西夏终于被打服了!但是很少有人知道,在这场胜利之前,大宋曾陷入一个诡异的死循环:明明占尽经济优势,西夏的粮食、茶叶、布匹等物资几乎全靠宋朝供给。司马光甚至说过这么一句话:西夏就像个婴儿,宋朝一断奶,立马就活不下去。然而每一次宋朝祭出贸易制裁的大棒,不仅没有让西夏服软,反而换来更加猛烈的攻击。打仗耗不起,占地守不住,经济制裁还适得其反。大宋就这样被西夏生生折磨了半个多世纪。问题到底出在哪儿?为什么堵死一条危险的路,反而逼着对方走上另一条更危险的路?看上去最省力的办法,为什么反而把局面越推越险?对于历史爱好者来说,此模板能够帮助他们更深入地理解宋夏之间的经济与政治博弈,拓宽历史视野;历史学者可以借助该模板的结构和思路,进一步开展相关研究。
在历史文化的浩瀚海洋中,传国玉玺一直笼罩着神秘的光辉,而公元1098年关于假玉玺为何似有真魔力的探讨更是引人入胜。这张关于《公元1098年:假玉玺怎么有真魔力?》的思维导图模板,源自《文明之旅》第99期,由主讲人罗振宇呈现,为历史爱好者、文化研究者以及广大学生群体打开了一扇深入探索历史奥秘的窗口。系统梳理了传国玉玺的历史流变、政治功能与“共同知识”理论。内容涵盖传国玉玺从秦汉到明清的流传简史、1098年北宋哲宗时期咸阳百姓段义献玺事件、鉴定过程与朝堂争议,以及“假玉玺为何能产生真魔力”的深层政治逻辑。图中引入“共同知识”“预期协调”“信物效应”等概念,结合宋真宗“天书封禅”、辽朝科举命题、元朝皇位继承等历史案例,阐释政治象征物如何凝聚共识、构建合法性。适用于历史爱好者、政治学研究者、文化传播从业者、教育工作者及内容创作者,帮助理解中国古代政治运作中的符号力量与共识机制。对于历史爱好者而言,这张思维导图满足了他们对历史细节的探寻欲望,那些鲜为人知的发现过程、朝堂上的决策博弈都一一呈现。借助EdrawMind绘制的这张思维导图,将历史事件和人物关系以直观的图形展示出来,让读者能够轻松理解。
数据分析思维工具-回归分析
来源:圈外数据学院L1
案例:如何通过身高推算衣服的尺码
我们先收集很多人的肩宽和身高两个数据:
通过绘制散点图,求出公式,二者公式为:y=0.514x-31.415
有了这个公式,就可以将不同的身高,对应到不同的肩宽上面,从而形成一张对照量表。比如身高170cm的人,肩宽差不多是56cm,身高178cm的人,肩宽差不多是60cm,商家再按照肩宽去找相应的尺码,就可以引导用户购买了。
如果结合体重,准确度会更高。
这其实就是非常典型的线性回归分析的应用。
回归分析的定义
1、它涉及到两个及以上变量之间的关系。
2、这组关系可以用一个明确的方程来表示。线性回归分析的重点,就是通过工具计算出方程,找出方程才能根据一个变量进行另一个变量的测算。
3、回归方程可以用来对其中一个变量(因变量)进行预测。
和相关分析的区别
相关分析中两组变量的地位是平等的,是看相互之间的关系。而回归分析,是看一个变量调整后,如何根据精确的量化关系,来计算出另一个变量。
我们要计算的变量叫做因变量,而我们用来计算和推测的变量,叫做自变量。
相关分析和回归分析的差别:自变量与因变量
回归分析的作用
回归分析可以帮助我们做预测
回归分析可以帮助我们做决策
回归分析的种类
线性回归
一元线性回归
多元线性回归
非线性回归
一元线性回归
我们接触一元线性回归分析时,常常是需要通过操纵一个变量的数字,去估算和预测另一个变量的数字。比如打国费可以通过路程来估算。
案例:用回归分析,解决问题:平均菜价上涨10元,人均消费上涨多少?
第一步:确定自变量和因变量:价格是自变量x,而人均消费金额是因变量y.
第二步:绘制散点图:散点图能够快速判断自变量和应变量之间是否包含线性关系。
看起来, 两级数据具备线性相关,添加趋势线拟合后如下图。
第三步:求方程。任何线性相关的两组数据,都可以用方程表示出来。一元线性回归的标准形式,就是y=ax+b。
Excel求解一元线性回归方程的方法:在添加趋势线的同时,进入趋势线选项,选择勾选“显示公式”和“显示R平方值”,就可以自动显示了。
第四步,验证方程是否准确: 在相关分析中,我们曾使用相关系数R来检验两组变量的相关程度;在回归分析中,我们也需要观测R方的数值,来检验我们的回归方程是否足够准确。R方最大是1,越接近1,说明这组方程越准确。 在Excel中,绘制好了散点图,可以直接勾选显示R方,如图所示,这个方程的R方是0.9982,接近1,说明y=2.4688x+1.1807这个方程,能够反应菜品均价和人均消费金额之间的关系。 那回到我们的问题,菜品均价提升10元,对人均消费金额影响是多少?带入方程,就可以得出结果,约等于26元。
一元线性回归,在这种变量确定的问题中,能够快速确认变量关系,从而进行简单的预测和控制。 但现实工作生活中,很多问题的相关因素往往不止一个,同样一个y,可能受到很多x的影响。 如何解决包含多个变量的问题:需要掌握多元线性回归
一元和多元的差别:一个自变量对一个因变量就是一元,多个自变量对自变量对一个因变量,就是多元。同理,多元线性回归分析的方程,也可以参考一元线性回归的方程,进行扩充。
多元线性回归
多元线性回归方程:y=a1*1+a2*2+......aN*N+b 每个自变量影响程度不同,体现在方程里就是系数大小不同, 每个系数也可以标号,b1,b2,b3,以此类推。
用案例,在实际应用中学习多元线性回归: 假设我们在市中心经营一家冷饮店。天气预报显示下周会出现寒流,气温下降,周平均温度不过25摄氏度,我们担心会对冷饮店的生意有影响,准备下周保持55折的折扣力度。需要估算出,在气温25度、折扣力度55折的情况下,我们每日的业绩大概是多少。
第一步:用Excel整理和拉取数据
第二步,相关分析检验与筛选 得到数据后,首先进行基本的相关分析,确定每个自变量与因变量是否相关,如果相关,就纳入回归分析的方程,如果不相关,就删除。
计算结果如下: 气温和业绩的相关系数R1=0.8715 折扣力度和业绩的相关系数R2=-0.8122 喇叭吆喝和业绩的相关系数R3=-0.2249 可以发现,有没有吆喝跟业绩相关性不大,所以删除这组数据,只把气温*1和折扣力度*2纳入多元回归方程里。
第三步,列出初始方程:y=a1*1+a2*2+b 使用Excel求解多元线性回归方程,用LINEST函数就可以。 步骤如下:在数据分析一栏中选择”回归“
将每日业绩值输入Y值,气温和折扣力度输入X值,置信度默认90%,点击确定
最后我们可以得到这组多元回归的系数,分别为109.4687*1和-1626.8343*2和3272.2850,得到最终的回归方程为y=109.4687*1-1626.8343*2+3272.2850
但是,现实生活不是数学,随机因素影响着数据的稳定性。因此,在得出回归方程之后,我们还必须经过工具验证,来确认方程是否可信。这最后一步,就是显著性检验。
第四步,显著性检验: 需要验证方程的显著性系数F。F小于0.05,说明这组方程足够显著,可以使用。 在前面Excel求解方程式的过程中,已经有这个系数了,如图:
F=0.001167,远远小于0.05,可以证明这个方程是十分显著的
最后一步,就可以结合具体问题,开始预测了。 比如天气报下周开始降温,周平均温度只有25度,下周折扣力度为5.5折,通过方程,计算可知:下周日业绩为5114元。