导图社区 pandas数据读取

pandas数据读取

pandas数据读取知识总结，列之间的每列对应元素的运算只需要通过切片列名当成数据进行计算，有需要的可以看看。

编辑于2022-01-21 15:35:28

pandas数据读取

吴达实验理212

他的近期作品查看更多>>

pandas数据读取

社区模板帮助中心，点此进入>>

吴达实验理212

他的近期作品查看更多>>

相似推荐
大纲

论语孔子简单思维导图
- 90.4k
- 947
- 1.1k
- 490
- 1
MindMaster
《傅雷家书》思维导图
- 135.6k
- 1.7k
- 2.7k
- 1.3k
- 0
MindMaster
《童年》读书笔记
- 46.6k
- 488
- 987
- 337
- 0
MindMaster
《茶馆》思维导图
- 13.6k
- 176
- 181
- 40
- 0
MindMaster
《朝花夕拾》篇目思维导图
- 26.8k
- 532
- 1.2k
- 300
- 0
MindMaster
《昆虫记》思维导图
- 35.2k
- 272
- 778
- 279
- 0
MindMaster
《安徒生童话》思维导图
- 19.8k
- 277
- 264
- 66
- 0
MindMaster
《鲁滨逊漂流记》读书笔记
- 22.6k
- 310
- 551
- 166
- 0
MindMaster
《这样读书就够了》读书笔记
- 99.5k
- 12.9k
- 9.0k
- 2.2k
- 0
Ethan
妈妈必读：一张0-1岁孩子认知发展的精确时间表
- 11.3k
- 1.8k
- 411
- 38
- 0
Ethan

pandas数据读取

相当于excel

DataFrame

核心矩阵

数据读取

变量名=pandas.read_csv(“文件名称")

读取文件

变量名.shape

print(food.shape)显示数据的维度

核心常用，查明维度

例如（9，8）指的是文件有9个实例，每个实例有八个指标

变量名.head(括号里的参数显示图表的前几行）

变量名.tail(显示后几行）

变量名.columns指的是文件的列名

数据预处理

a=pandas.isnull(变量名列名）显示TF

找出缺失值：a1=列名[a]显示所有缺失项所在编号

a2=文件名["列名"][aTF==False]

找到无去缺失项的数据

子主题

数据的检索（切片）

变量名.loc[#中括号里面的是数据实例的编号数据的切片语法和表格实际上是一样的 ]#用于提取数据变量名.loc[行，列]

变量名[列名]#用于切出整个的列数据

新变量名=["列名1”，“列名2”] 变量名[新变量名]#传多个列

论如何找到不同单位的列 1先把所有列名装到一个列表里去2for if循环找出该列表里的所有以（g）结尾的字符，并将其装进一个新的列表中去

a=文件名.columns.tolist() for c in a: if c.endswich("（g）") 新列表.append(c)

求最值文件名[“列名”].max\min

数据计算

列之间的每列对应元素的运算只需要通过切片列名当成数据进行计算

将整列都除以一个数，用于换算单位变量=文件名["列名"]/数字

切片形式

列的添加

文件名["新列名"]=装有计算结果的列名

求和sum（切片形式的变量名）

.maen()求均值

排序

文件名.sort_value("列名”，inplace=True/False，ascending=True\False)

inplaceT则为在源文件进行处理，ascending是升序还是降序，默认升序 nan为缺失值，放在最后。

数据透视函数：.pivot_table(index=”类别名称“，values=”所对应的列别名称，包含不同的值“，aggfunc=numpy.mean等其他函数）

series

列向量

from pandas import series

操作相同

用法

1调用库

2读取文件

形成矩阵

3数据的预处理

处理缺失项

用中位数，众数，平均数填充

直接不录入

4循环拿数据，定位列，函数求值，输出

自定义函数

def 函数名称（） return

操作列向量

主题

问题

缺失值的处理

文件题目的来源

处理数据文件

标注

csv文件

在pandas里字符型数据为object

object

int

datatime

bool

float

浮动主题

ndarray

浮动主题