导图社区 第五章数据分析
这是一篇关于文件写操作,常用统计函数,和排序函数等的思维导图。内容全面,框架清晰。适合知识点整理的小伙伴。
编辑于2022-10-14 13:54:34 山西第五章
5.1
文件写操作
savetxt() 对后缀名为.txt和.csv的文件进行写操作。 将一维或二维数组写入后缀名为.txt或.csv的文件
save() saves() 写入二进制格式文件
tofile()
此函数用数组名调用
写入多维数组文件
文件读操作
loadtxt() 对后缀名为.txt和.csv的文件进行读操作。
load() 读取二进制格式文件
fromfile()
读取多维数组文件
相关参数
fnnname:文件名
dtype:数据类型
delimiter:分割符
usecols:选取数据的列
5.2
常用统计函数
最小值
amin() nanmin()
参数out:代替输出数组,用于放置结果
最大值
amax() nanmax()
参数out:代替输出数组,用于放置结果
百分位数
percentile() nanpercentile()
参数:q:[1,100]范围的浮点数
中位数
median() nanmedian()
求和
sum()
加权平均值
average()
参数weight:权重值
算术平均值
mean() nanmean()
标准差
std() nanstd()
方差
var() nanvar()
共有相关参数
a:输入数组
axis:沿着某个轴来进行计算
5.3
排序函数
sort()
返回输入数组的排序副本
argsort()
用于使输入数组沿着给定轴执行间接排序,并根据指定排序类型返回数据的索引数组
lexsort()
使用键序列执行间接排序,返回一个索引数组,最后一个键是排序的主键
参数
arr:输入数组
axis:沿某个指定周排序
order:如果数组包含字段,,则用于指明排序的字段
去重函数
unique()
返回输入数组中所有不同的值,并按照从小到大的顺序排列
参数
return_index
如果为true返回输入数组中去除数组的索引数组
return_inverse
如果为true返回去重数组的下标
return_counts
返回去重数组的元素在元素组中的出现次数
重复函数
tile()
该函数的作用是将一个已有的数组重复一定的次数
参数
a 参数a需要指定重复的数组
reps 参数指定重复的次数
repeat()
参数
a 参数a需要指定重复的数组
repeats 参数指定重复的次数
axis 参数指定沿哪个轴进行重复
np.repeat
库引用
整体重复
arr.repeat
数组引用
分开重复
搜索和计数函数
aragmin()argmax()
用于沿指定轴返回最小值的索引 用于沿指定轴返回最大值的索引
nanargmin()nanrgmax()
用于沿指定轴返回忽略了NaN的最小值的索引 用于沿指定轴返回忽略了NaN的最大值的索引
nonzero()
返回输入数组中非0元素的索引
where()
x为条件表达式,y为x为True时的取值,z为x为False的取值
用于返回输入数组中满足给定条件x的元素的索引或者是当给定的条件x为True时,返回y数据,否则返回z数据
extract()
用于返还满足任何条件的元素
count_nonzero()
可以统计NumPy数组中非0元素的个数
nan为忽略了NaN的值的数组