导图社区 pandas数据读取
pandas数据读取知识总结,列之间的每列对应元素的运算只需要通过切片列名当成数据进行计算,有需要的可以看看。
决策树的数学表达和代码实现,包括有监督机器学习,数字表达,决策树的内容、优点和缺点等等,有兴趣的看看。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
pandas数据读取
相当于excel
DataFrame
核心矩阵
数据读取
变量名=pandas.read_csv(“文件名称")
读取文件
变量名.shape
print(food.shape)显示数据的维度
核心常用,查明维度
例如(9,8)指的是文件有9个实例,每个实例有八个指标
变量名.head(括号里的参数显示图表的前几行)
变量名.tail(显示后几行)
变量名.columns指的是文件的列名
数据预处理
a=pandas.isnull(变量名列名)显示TF
找出缺失值:a1=列名[a]显示所有缺失项所在编号
a2=文件名["列名"][aTF==False]
找到无去缺失项的数据
子主题
数据的检索(切片)
变量名.loc[#中括号里面的是数据实例的编号 数据的切片语法和表格实际上是一样的 ]#用于提取数据 变量名.loc[行,列]
变量名[列名]#用于切出整个的列数据
新变量名=["列名1”,“列名2”] 变量名[新变量名]#传多个列
论如何找到不同单位的列 1先把所有列名装到一个列表里去2for if循环找出该列表里的所有以(g)结尾的字符,并将其装进一个新的列表中去
a=文件名.columns.tolist() for c in a: if c.endswich("(g)") 新列表.append(c)
求最值 文件名[“列名”].max\min
数据计算
列之间的每列对应元素的运算只需要通过切片列名当成数据进行计算
将整列都除以一个数,用于换算单位 变量=文件名["列名"]/数字
切片形式
列的添加
文件名["新列名"]=装有计算结果的列名
求和sum(切片形式的变量名)
.maen()求均值
排序
文件名.sort_value("列名”,inplace=True/False,ascending=True\False)
inplaceT则为在源文件进行处理,ascending是升序还是降序,默认升序 nan为缺失值,放在最后。
数据透视函数:.pivot_table(index=”类别名称“,values=”所对应的列别名称,包含不同的值“,aggfunc=numpy.mean等其他函数)
series
列向量
from pandas import series
操作相同
用法
1调用库
2读取文件
形成矩阵
3数据的预处理
处理缺失项
用中位数,众数,平均数填充
直接不录入
4循环拿数据,定位列,函数求值,输出
自定义函数
def 函数名称() return
操作列向量
主题
问题
缺失值的处理
文件题目的来源
处理数据文件
标注
csv文件
在pandas里字符型数据为object
object
int
datatime
bool
float
浮动主题
ndarray
中心主题