导图社区 《数据分析入门准备》
《数据分析入门准备》,转行前的准备,写给有同样需求的你。 数据分析是指运用统计方法和分析工具对大量数据进行分析,挖掘出其潜在规律及价值,为经营决策提供科学严谨的理性依据。其中当然离不开数学与统计学的知识,需要有微积分、线性代数、概率论与数理统计等相关的知识储备才行。
这是一篇关于学习笔记-薪酬诊断与调查的思维导图,掌握薪酬设计的基本框架及薪酬日常管理的内容。
社区模板帮助中心,点此进入>>
无人机职业教育五大体系“证证融通”
《中国图书馆分类法》第五版(简图)
游泳救生员(游泳池救生)(第2版)
中国孕妇泰国坠崖案
冠军读书笔记1-《了不起的盖茨比》
冠军读书笔记2-《为爱朗读》
共情式沟通 2023.6.28 详细版
创意工具scamper(奔驰法)
人工智能GPT提示词汇总
只管去做 2023.6.28
数据分析入门准备
了解数据分析行业
岗位方向
数据分析师
从事数据采集、整理、分析,发现问题,分析问题,得出结论,为公司的决策层提供数据支持。偏向于业务。
数据挖掘工程师/算法工程师
利用模型训练数据,从海量数据中挖掘规律,预测或分类对象,主要偏向编程和算法,对统计理论知识要求偏高。
数据开发工程师
设计、搭建并维护基础设施,以提供数据收集、存储、处理、计算等平台。偏代码开发,需要在代码能力上弥补,但与纯技术栈的程序员相比需要一定的业务逻辑。
数据产品经理
主要负责以数据为导向提炼需求、设计、规划、项目排期至项目落地,以及后期的产品改进和优化等。
基础知识
数学与统计基础
数据分析是指运用统计方法和分析工具对大量数据进行分析,挖掘出其潜在规律及价值,为经营决策提供科学严谨的理性依据。其中当然离不开数学与统计学的知识,需要有微积分、线性代数、概率论与数理统计等相关的知识储备才行。
分析工具
掌握基础的数据分析工具Excel与统计分析工具SPSS的用法
SQL数据库语言
数据的存储便离不开使用数据库,需掌握SQL数据库语言在关系型数据库系统中进行增删改查等操作才行。
编程语言
数据分析的进阶需要会使用一门或多门编程语言,如Python和R,会使数据分析变得更加高效。
机器学习算法入门
需要学习常用的分类、回归、聚类和降维等的常用算法以及它们的优缺点和使用场景。
明确数据分析学习路线
1.基础篇 (适用于初级数据分析师)
excel
关键知识点
excel基本函数 sumif,countif,left,rand等、 lookup(vlookup/hlookup)
数据透视表
学习资源
根据关键知识点,自行搜索用法+练习即可
学习时长
一周(一天4小时算)
sql
增删改查,特别是条件查询(where, group by, order by等)
一周半(一天4小时算)
python
numpy,pandas,matplotib,seaborn包的熟练使用
6周(一天4小时算)
统计学
概率论、假设检验、分布(泊松、二项、正态等)、统计抽样等
《深入浅出统计学》比较适合小白入门,书很厚,别怕,都是图
3周(一天4小时)
2.进阶篇 (适用于中级数据分析师、数据挖掘工程师))
数学知识
线性代数: 矩阵运算,矩阵特征(秩、迹、特征值特征矩阵、相似矩阵、正定矩阵、逆矩阵、非奇异、行列式)、线性相关,向量空间,向量范数,矩阵范数,最小二乘法,最大似然估计
微分: 极限,导数,偏导数,泰勒展开,梯度下降法,牛顿法
凸优化: 基本概念(凸集合,凸函数,上境图,凸组合,凸包),凸优化(拉格朗日对偶性,对偶问题,KKT条件,拉格朗日乘数法)
4周(一天4小时算,最好学过高等数学)
数据挖掘算法
分类、回归、聚类、关联规则挖掘、降维等
《统计学习方法》经典,主讲分类算法,偏理论推导
《机器学习实战》过瘾,对着《统计学习方法》来一套,保证你对理论明明白白
《机器学习》周志华老师的,也是经典
神经网络