导图社区 pandas新手教程的核心内容
可以对整行整列进行汇总计算、groupby可以实现split-apply-combine模式、value_counts是计算每个类型变量的快捷方式
按Pandas中文网的《10分钟入门》教程做的导图,内容实在庞杂,一张图获取可以能更快的了解pandas的大体架构。
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
pandas核心内容
01.怎样处理数据
import pandas as pd
表格数据被储存为DataFrame
DataFrame的每列是Series
DataFrame和Series都具有类方法
02.怎样读写数据
可以读写的数据形式很多
read_*
to_*
03.怎样选取子集
用 方括号[] 选取子集
在括号里面, 可以是单个行/列的标签、行/列的标签的列表、切片、条件
用 loc 时,用行/列的名字(label name)
用 iloc时,用行/列的位置(索引值,不含后)
用 loc/iloc的时候可以重新个DataFrame数据进行赋值。
04.怎样绘制图形
plot.系列方法对Series和DataFrame都有用
每一列默认用不同的图形表示
Pandas的plot都是Matplotlib对象
05.怎样扩展新列
新增列的方法就是`DataFrame['新列名称']`
对新增列不用对行进行循环
可以通过字典或函数的方法对行列进行重命名
10.处理字符串类
可以使用str访问器使用字符串方法
字符串方法以元素为单位工作,可以用于条件索引
replace方法是一种根据给定字典转换值的方便方法
09.运用时间序列
使用to_datetime函数或作为read函数的一部分,可以将有效的日期字符串转换为datetime对象
pandas中的Datetime对象使用dt访问器支持计算、逻辑操作和方便的日期相关属性
DatetimeIndex包含这些与日期相关的属性,并支持方便的切片
重采样是改变时间序列频率的一种强有力的方法
08.怎么合并表格
concat()
多个表按行合并,按列合并
merge()
类似数据库操作时,用这个
07.怎样重构表格
sort_values 可以对一个或多个列进行排序
pivot函数就是重构数据,pivot后的表格也支持聚合
pivot (long to wide format) 的反向操作是 melt (wide to long format)
06.怎样汇总统计
可以对整行整列进行汇总计算
groupby可以实现split-apply-combine模式
value_counts是计算每个类型变量的快捷方式