导图社区 python数据分析与展示
这是一篇关于python数据分析与展示的思维导图。
编辑于2022-04-11 10:04:08
numpy
ndarray
属性
对于不同质,当作对象
创建
列表,元组等类型
numpy中函数
从字节流
从文件中
数组变换
元素变换
维度变换
转换为列表
索引与切片
索引
切片
计算
高维与低维运算(不同维度),为广播运算;相同维度,对应计算
csv文件
存取一维/两维数据
np.savetxt
np.loadtxt()
存取多维数据
np.tofile()
np.fromfile()
np便捷文件存取
随机函数库
统计函数
梯度函数
matplotlib
plt,axis()
plt.plot()
plt.subplot()
中文显示
第一种方法(全局更改)
第二种方法(局部更改)
子图划分
plt,subplot2grid()
GridSpec类
文本显示
pyplot基础函数
绘制饼图
plt.axis('equal')表示绘制正圆形饼图
绘制条形图
bins代表从最小值到最大值等距离划分的直方图的个数
density
值为1,代表归一化的值
值为0,代表真实个数
绘制极坐标图
绘制散点图
pandas
Series
索引
自动索引
自定义索引
如何创建
标量
组合数据类型
列表
字典
元组
ndarray
其他函数
基本操作
切片
两套索引不能混用
自动索引,就像列表那样(左闭右开)
自定义索引,(左闭右闭)
.name属性
.index .values
类np操作
类字典操作
类型对齐操作
NaN和任何操作运算均为NaN
DataFrame
定义
创建
重新索引
索引类型常用方法
删除指定索引对象
基本操作
加减乘除
符号表示
方法表示
不同维度,降维运算,默认在1轴
相同维度,尺寸一致
排序
基本统计分析
Series
DataFrame
累计统计分析
相关分析