导图社区 Pandas使用方法
关于Pandas使用方法的思维导图,具体分为安装、导入、数据结构、数据选择、数据操作、数据统计,一起来看。
董宇辉在平谷中学演讲中的主要思想和观点,教育的重要性、 坚持与努力、 树立正确价值观等。
董宇辉在中国传媒大学演讲的主要思想和观点,痛苦与焦虑的积极作用、定力的重要性、不忘初心与成长阵痛。
《活着》是一部伟大的现实主义作品,以福贵的人生经历为主线,讲述了一个普通农民家庭在中国社会历史变迁中的沉浮起伏。它让我深刻理解了生活的真谛和人性的光辉。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
Pandas使用方法
安装
`pip install pandas`
导入
`import pandas as pd`
数据结构
Series
一维数组对象
创建
示例1: `s = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd'])`
创建一个Series,索引为`['a', 'b', 'c', 'd']`,值为`[3, -5, 7, 4]`
示例2: `s = pd.Series({'a': 3, 'b': -5, 'c': 7, 'd': 4})`
通过字典创建一个Series
属性
`index`: `s.index`
`values`: `s.values`
方法
`head(n)`: 显示前n行数据,如`s.head(2)`
`tail(n)`: 显示后n行数据,如`s.tail(2)`
DataFrame
二维表格型数据结构
通过字典创建
示例1: `df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})`
创建一个DataFrame,列名为`['A', 'B']`,值为`[[1, 2, 3], [4, 5, 6]]`
通过列表创建
示例2: `df = pd.DataFrame([{'A': 1, 'B': 4}, {'A': 2, 'B': 5}, {'A': 3, 'B': 6}])`
通过字典列表创建一个DataFrame
从文件读取数据
示例3: `df = pd.read_csv('filename.csv')`
从CSV文件中读取数据创建DataFrame
示例4: `df = pd.read_excel('filename.xlsx')`
从Excel文件中读取数据创建DataFrame
`columns`: 列名,如`df.columns`
`index`: 行索引,如`df.index`
`shape`: 数据框形状,如`df.shape`
`size`: 数据框元素总数,如`df.size`
`head(n)`: 显示前n行数据,如`df.head(2)`
`tail(n)`: 显示后n行数据,如`df.tail(2)`
`rename(columns=dict)`: 重命名列,如`df.rename(columns={'A': 'X', 'B': 'Y'})`
`drop(labels, axis=0/1)`: 删除行或列,如`df.drop('B', axis=1)`
`set_index(keys)`: 设置索引,如`df.set_index('A')`
数据选择
选择列
示例1: `df['A']`
选择名为'A'的列
示例2: `df.A`
选择名为'A'的列(另一种写法)
选择行
示例3: `df.loc[0]`
使用标签选择第一行
示例4: `df.iloc[0]`
使用整数位置选择第一行
按条件筛选
示例5: `df[df['A'] > 1]`
选择列'A'值大于1的所有行
切片操作
示例6: `df.iloc[0:2]`
使用整数位置切片选择前两行
示例7: `df.loc[0:1]`
使用标签切片选择前两行
数据操作
数据清洗
缺失值处理
删除缺失值
示例1: `df.dropna()`
删除包含NaN值的所有行
填充缺失值
示例2: `df.fillna(value)`
使用指定值填充NaN值
数据类型转换
示例3: `df.astype({'A': 'float64'})`
将列'A'的数据类型转换为float64
数据合并
水平合并
示例4: `pd.concat([df1, df2], axis=1)`
将df1和df2在水平方向上进行拼接
垂直合并
示例5: `pd.concat([df1, df2], axis=0)`
将df1和df2在垂直方向上进行拼接
数据连接
示例6: `pd.merge(df1, df2, on='key_column')`
根据指定列名进行数据连接
数据分组
示例7: `grouped = df.groupby('A')`
按照列'A'的值进行分组
聚合函数
求和: `grouped.sum()`
平均值: `grouped.mean()`
计数: `grouped.count()`
数据排序
示例8: `df.sort_values(by='A')`
根据列'A'的值进行升序排序
数据变换
示例9: `df['A'].apply(lambda x: x * 2)`
对列'A'的每个元素进行乘以2的操作
示例10: `df['A'].map(lambda x: x * 2)`
对列'A'的每个元素进行乘以2的操作(另一种写法)
数据统计
描述性统计
示例1: `df.describe()`
显示数据框的描述性统计信息
统计函数
求和: `df.sum()`
平均值: `df.mean()`
中位数: `df.median()`
标准差: `df.std()`
最小值: `df.min()`
最大值: `df.max()`
计数: `df.count()`
方差: `df.var()`