导图社区 pandas中DataFrame的使用
关于pandas中DataFrame的使用的思维导图,内容有 创建DataFrame、数据选择与筛选、数据操作、数据可视化、数据处理。
董宇辉在平谷中学演讲中的主要思想和观点,教育的重要性、 坚持与努力、 树立正确价值观等。
董宇辉在中国传媒大学演讲的主要思想和观点,痛苦与焦虑的积极作用、定力的重要性、不忘初心与成长阵痛。
《活着》是一部伟大的现实主义作品,以福贵的人生经历为主线,讲述了一个普通农民家庭在中国社会历史变迁中的沉浮起伏。它让我深刻理解了生活的真谛和人性的光辉。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
pandas中DataFrame的使用
创建DataFrame
从字典创建
`pd.DataFrame({'列名1':[数值1, 数值2, ...], '列名2':[数值1, 数值2, ...], ...})`
从列表创建
`pd.DataFrame([[数值1, 数值2, ...], [数值1, 数值2, ...], ...], columns=['列名1', '列名2', ...])`
从numpy数组创建
`pd.DataFrame(numpy数组, columns=['列名1', '列名2', ...])`
从csv文件读取
`pd.read_csv('文件路径')`
数据选择与筛选
列选择
`dataframe['列名']` 或者 `dataframe.列名`
行选择
`dataframe.loc[索引名称]` 或者 `dataframe.iloc[索引位置]`
多条件筛选
`dataframe[(条件1) & (条件2)]`
条件赋值
`dataframe.loc[条件, '列名'] = 新数值`
数据操作
添加列
`dataframe['新列名'] = [数值1, 数值2, ...]`
删除列
`dataframe.drop(['列名'], axis=1)`
修改数据
`dataframe.loc[行索引, '列名'] = 新数值`
排序
`dataframe.sort_values(by='列名', ascending=True/False)`
合并
`pd.concat([dataframe1, dataframe2], axis=0/1)`
分组
`dataframe.groupby('列名')`
聚合
`dataframe.agg({'列名1': 'sum', '列名2': 'mean'})`
数据可视化
折线图
`dataframe.plot(x='x轴列名', y='y轴列名', kind='line')`
散点图
`dataframe.plot(x='x轴列名', y='y轴列名', kind='scatter')`
直方图
`dataframe['列名'].plot(kind='hist')`
饼图
`dataframe['列名'].value_counts().plot(kind='pie')`
数据处理
缺失值处理
`dataframe.dropna()` 或者 `dataframe.fillna(填充值)`
重复值处理
`dataframe.drop_duplicates(subset=['列名'])`
数据类型转换
`dataframe['列名'] = dataframe['列名'].astype('新数据类型')`
数据归一化
`(dataframe['列名'] - dataframe['列名'].min()) / (dataframe['列名'].max() - dataframe['列名'].min())`
数据标准化
`(dataframe['列名'] - dataframe['列名'].mean()) / dataframe['列名'].std()`