导图社区 Pandas使用方法

Pandas使用方法

关于Pandas使用方法的思维导图，具体分为安装、导入、数据结构、数据选择、数据操作、数据统计，一起来看。

编辑于2023-05-18 19:30:14 云南

yzk

他的近期作品查看更多>>

Pandas使用方法

社区模板帮助中心，点此进入>>

yzk

他的近期作品查看更多>>

相似推荐
大纲

互联网9大思维
- 39.9k
- 977
- 2.5k
- 401
- 0
MindMaster
组织架构-单商户商城webAPP 思维导图。
- 18.7k
- 3
- 186
- 9
- 1
Kacyun
域控上线
- 4.4k
- 171
- 11
- 4
- 0
jackrao
python思维导图
- 9.7k
- 557
- 242
- 7
- 0
(*^▽^*)
css
- 3.9k
- 1
- 43
- 3
- 0
A张舫
CSS
- 6.4k
- 272
- 189
- 33
- 0
journey
计算机操作系统思维导图
- 8.1k
- 354
- 209
- 16
- 0
journey
计算机组成原理
- 4.1k
- 98
- 71
- 8
- 0
journey
IMX6UL(A7)
- 2.7k
- 41
- 5
- 0
- 0
Handler XU
考试学情分析系统
- 3.7k
- 51
- 10
- 1
- 0
蒋龙

Pandas使用方法

安装

`pip install pandas`

导入

`import pandas as pd`

数据结构

Series

一维数组对象

创建

示例1: `s = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd'])`

创建一个Series，索引为`['a', 'b', 'c', 'd']`，值为`[3, -5, 7, 4]`

示例2: `s = pd.Series({'a': 3, 'b': -5, 'c': 7, 'd': 4})`

通过字典创建一个Series

属性

`index`: `s.index`

`values`: `s.values`

方法

`head(n)`: 显示前n行数据，如`s.head(2)`

`tail(n)`: 显示后n行数据，如`s.tail(2)`

DataFrame

二维表格型数据结构

创建

通过字典创建

示例1: `df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})`

创建一个DataFrame，列名为`['A', 'B']`，值为`[[1, 2, 3], [4, 5, 6]]`

通过列表创建

示例2: `df = pd.DataFrame([{'A': 1, 'B': 4}, {'A': 2, 'B': 5}, {'A': 3, 'B': 6}])`

通过字典列表创建一个DataFrame

从文件读取数据

示例3: `df = pd.read_csv('filename.csv')`

从CSV文件中读取数据创建DataFrame

示例4: `df = pd.read_excel('filename.xlsx')`

从Excel文件中读取数据创建DataFrame

属性

`columns`: 列名，如`df.columns`

`index`: 行索引，如`df.index`

`shape`: 数据框形状，如`df.shape`

`size`: 数据框元素总数，如`df.size`

方法

`head(n)`: 显示前n行数据，如`df.head(2)`

`tail(n)`: 显示后n行数据，如`df.tail(2)`

`rename(columns=dict)`: 重命名列，如`df.rename(columns={'A': 'X', 'B': 'Y'})`

`drop(labels, axis=0/1)`: 删除行或列，如`df.drop('B', axis=1)`

`set_index(keys)`: 设置索引，如`df.set_index('A')`

数据选择

选择列

示例1: `df['A']`

选择名为'A'的列

示例2: `df.A`

选择名为'A'的列（另一种写法）

选择行

示例3: `df.loc[0]`

使用标签选择第一行

示例4: `df.iloc[0]`

使用整数位置选择第一行

按条件筛选

示例5: `df[df['A'] > 1]`

选择列'A'值大于1的所有行

切片操作

示例6: `df.iloc[0:2]`

使用整数位置切片选择前两行

示例7: `df.loc[0:1]`

使用标签切片选择前两行

数据操作

数据清洗

缺失值处理

删除缺失值

示例1: `df.dropna()`

删除包含NaN值的所有行

填充缺失值

示例2: `df.fillna(value)`

使用指定值填充NaN值

数据类型转换

示例3: `df.astype({'A': 'float64'})`

将列'A'的数据类型转换为float64

数据合并

水平合并

示例4: `pd.concat([df1, df2], axis=1)`

将df1和df2在水平方向上进行拼接

垂直合并

示例5: `pd.concat([df1, df2], axis=0)`

将df1和df2在垂直方向上进行拼接

数据连接

示例6: `pd.merge(df1, df2, on='key_column')`

根据指定列名进行数据连接

数据分组

示例7: `grouped = df.groupby('A')`

按照列'A'的值进行分组

聚合函数

求和: `grouped.sum()`

平均值: `grouped.mean()`

计数: `grouped.count()`

数据排序

示例8: `df.sort_values(by='A')`

根据列'A'的值进行升序排序

数据变换

示例9: `df['A'].apply(lambda x: x * 2)`

对列'A'的每个元素进行乘以2的操作

示例10: `df['A'].map(lambda x: x * 2)`

对列'A'的每个元素进行乘以2的操作（另一种写法）

数据统计

描述性统计

示例1: `df.describe()`

显示数据框的描述性统计信息

统计函数

求和: `df.sum()`

平均值: `df.mean()`

中位数: `df.median()`

标准差: `df.std()`

最小值: `df.min()`

最大值: `df.max()`

计数: `df.count()`

方差: `df.var()`