导图社区 数据分析全流程分解
数据分析全流程分解,包含问题确认、数据获取、数据探索与预处理、数据建模、分析结果并提出优化建议,进一步推动建议落地,形成结果评估反馈。
品牌策略,产品策略,营销策略等,霸王茶姬的品牌策略的核心在于其独特的品牌定位和形象塑造。通过对年轻消费群体的深入理解,霸王茶姬成功地将自己定位为时尚与健康的代表,通过鲜明的品牌形象和故事,吸引了大量忠实粉丝。其产品策略则强调不断的产品创新和质量保障,从选材到制作,每一个环节都力求完美,确保每一杯茶饮都能给消费者带来极致的味觉享受。而霸王茶姬的营销策略则充分利用了社交媒体的力量,通过线上线下的联动,创造了无数话题和热点,与消费者建立了深厚的情感连接。
大模型概念、发展历程与产品及行业应用;企业大模型的落地方案和智能体的企业应用,以及企业级大模型服务和应用案例。
蜜雪冰城凭借“极致性价比 供应链垂直整合 轻资产加盟”模式,实现全球门店规模领先,供应链壁垒深厚,下沉市场与海外扩张双轮驱动,未来增长空间广阔,投资价值显著。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
数据分析全流程分解
1.明确问题
发现和界定问题(麦肯锡七步法)
1. 陈述问题:明确要解决的问题
2. 分解问题:利用逻辑树对问题进行分解
3. 消除非关键问题:使用漏斗法
4. 制定详细工作计划
5. 进行关键分析
6. 综合分析调差结果,并建立论证
7. 总结:完整讲述é故事û,阐述所持论点的完整结构
问题拆解
逻辑树法:例如[MECE原则]
业务公式法:例如[点赞数=阅读数´点赞率],[销售额=下单用户数´客单价]等
业务流程法:例如[UJM模型],[AARRR模型]
成熟模型法:例如[PEST模型],[SWOT分析],[波士顿矩阵]等
2.数据获取
数据获取
常用的数据获取渠道丰富,比如: >企业外部数据:外部购买、网络爬取、免费开源数据等; >企业内部数据:生产、销售、研发、人力资源、财务数据等;
综合型数据平台:阿里研究部,腾讯大数据,艾瑞网,尼尔森,数据银行等
行为细分数据平台:中国产业信息网,达标数据等
构建数据仓库(DB data base)
1. 数据抽取(Extract):通过接口提取数据,例如ODBC,专用数据库接口和平面文件提取器,并参照元数据来决定数据的提取以及提取方式
2. 数据转换(Transform):开发者将提取的数据,按照业务需求转换为目标数据接口,并实现汇总
3. 数据装载(Load):加载经转换和汇总的数据到目标数据仓库中,可实现SQL或批量加载
3.数据探索与预处理
数据探索
1. 数据的描述性统计:【简单统计量分析】查看最大值和最小值,用来判断这个变量的取值是否在合理范围内。
2. 数据的集中趋势:【3倍标准差原则】如果数据服从正态分布,在该原则下异常值被定义为一组测定值中与平均值的偏差超过3倍标准差的值。
3. 数据的离散程度:【箱线图分析】箱子的高度在一定程度上反映了数据的波动程度。上下边缘则代表了该组数据的最大值和最小值。有时候箱子外部会有一些点,可以理解为数据的"异常值"。
4. 数据的相关诊断性
a. 图表相关分析【折线图及散点图】
b. 协方差及协方差矩阵
c. 相关系数
d. 一元回归及多元回归
e. 信息熵交互信息
预处理
数据清洗
缺失值处理
异常值处理
噪声处理
数据集成
合并不同来源的数据
合并不同来源的主数据,统一主键;合并由于实体名字定义的相同数据
识别和解决不同数据值的冲突
移除重复数据和冗余数据
数据转换
数据平滑
归一化
标准化
中心化
数据减少
降维
聚合和聚类
采样
数据离散
等宽离散法
等频离散法
聚类离散法
分为数法
卡方
二值法
4.数据建模
建立模型
机器学习模型分为【(有)监督模型】和【无监督模型】,几乎所有模型都可以归类到这两类模型中。
1.(有)监督模型:是指模型在训练过程中根据输入和输出进行学习,包括聚类、回归等
线性模型:线性回归,逻辑回归,Lasso,Ridge,LDA
K近邻
决策树:ID3,C5.0,CART
神经网络:感知机,线性支持,线性不可分
2.无监督模型:是指从无标注的数据中学习得到的模型,包括聚类、降维和一部分概率估计模型
聚类:Kmeans,层次聚类,谱聚类
降维:PCA,SVD
概率模型
EM算法
MCMC
贝叶斯:朴素贝叶斯,贝叶斯网络
概率图:CRF,HMM
最大熵模型
5.结果分析
可视化展示
基础图表
高级图表
编写报告
a. 概要:标题、目录、分析背景、分析目的、关键结论
b. 分析说明:概念定义、指标口径、取样说明
c. 主题内容:分析思路、数据解读、分析步骤
d. 总结建议:测试方案、预估效果、ROI目标、时间计划
e. 附录:关键代码、元数据、参考文献
6.推动建议落地、结果评估反馈
推动建议落地
分析充分、提出方案、向上汇报、分配资源
落地执行、测试及效果反馈
迭代测试方案并制定下步计划
结果评估反馈(SMART原则)
a. 明确性:清晰说明要达成的行为标准
b. 衡量性:目标明确可衡量界定
c. 可实现性:可以让执行人实现的方案
d. 相关性:实现此目标与其他目标的关联情况
e. 时限性:目标是有使劲按限制的