导图社区 pandas 数据操作体系
掌握Pandas核心技巧,轻松玩转数据分析! 本篇思维导图系统梳理Pandas数据操作体系:按照数据流程:左分支从数据预览→清洗转换→数据处理→数据选择,右分支对数据应用,从数据拼接→分组聚合→描述统计→时序分析,涵盖选择技巧(标签/位置筛选)、分组聚合操作,以及时间序列处理(重采样、窗口计算)详解数学运算和统计方法(相关性分析、极值分析),助你快速构建数据分析工作流。
当运行程序时,数据会以变量、序列或者对象的形式,在程序中临时存储。但当程序运行结束之后,数据也随之消失。如果我们想长期保存数据,那么就需要将数据存储到磁盘文件中,这就需要通过Python读写文件,即I/O操作。I/O操作有三步:1、打开文件;2、文件读写;3、关闭文件(或者编写成with语句)。 本篇思维导图,即是围绕而操作的核心——文件对象(file_obj)来展开讲解,分为2个部分:一、file_obj的创建(open函数);二、file_obj的方法调用(读取文件、写入文件、文件指针以及最后的关闭文件)。 希望通过本篇思维导图,能帮助你对使用Python进行文件读写有更深的理解与认识!
Python数据类型,从整体来看,以数字、文本为基础,用列表、字典、元组、集合作为容器;以性质划分,又分为可变与不可变数据。 本篇思维导图为大家讲解的即是Python中作为基础数据的数字(包含整型、浮点型、复数)。 数字本身的内容不多,重点在其有多样的表现形式。然后,对数字的相关处理方式(运算 函数)。 值得注意的是,整型就是整数,但是,浮点型不等于小数,也表达不了分数。所有针对于小数及分数的运算,补充了Decimal类、Praction类的讲解部分。 最后,对于数字运算有重要关系的math模块,将相关的函数及特殊值进行汇总,希望对大家在用到数学运算的时侯带来帮助。 本篇导图逻辑清晰、内容完整,希望能对想要深入学习Python的您带来帮助!
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
Pandas 数据操作体系
特殊选择
.filter(items, like, regex, axis)
.select_dtypes(include, exclude)
高级索引
pd.IndexSlice
用于loc[]/iloc[]
df.xs(key, level, axis)
特定层级
条件筛选
.query(expr_string)
支持@变量
.where(cond)/.mask(cond)
条件替换
& | ~
位运算
.isin(values)
.isna()/.notna()
s.between(left, right, inclusive)
基于位置
.iloc[]
.take(indices, axis)
基于标签
.loc[]
支持
单元素、切片、列表、布尔数组/Series
数据选择
函数应用
元素.applymap()
行列.apply()
列.map()
数学运算
.add()
.sub()
.mul()
.div()
df ± 标量
.dot()
列 操 作
新增.assign()/.insert(), 赋值法 删.drop()/.pop(), 重命名.rename(),
增删改
行 操 作
删.drop(), 增pd.concat(), 赋值法
数据操作与计算
值 替 换
.replace(to_replace, value, regex, method)
数据类型转换
.astype()
.convert_dtypes()
pd.to_datetime()
pd.to_numeric()
重复值处理
.duplicated(subset)
.drop_duplicates(subset)
缺失值处理
.isna()
.fillna()
.dropna(how, subset)
数据清洗与转换
统计摘要
.describe()
.nunique()
.value_counts()
缺失值分析
.isna().sum()
.isna().mean()
.notna().any()
数据结构信息
.info()
.index/.columns
.shape/.ndim
.dtypes
.memory_usage()
数据预览
.head/.tail(n)
前/后n行数据
.nlargest/.nsmallest(n, columns)
排序,取前n行
.sample(n)
随机抽样
数据信息查看
制图人 | 咖啡喵 制图时间 | 2025.8.12 制图软件 | MindMaster
数据重塑与合并
结构变换
.pivot(index, columns, values)
整理透视
.pivot_table(aggfunc)
聚合透视
pd.melt(frame)
数据融合
.stack()/.unstack()
数据堆叠/解堆
.explode(column)
爆炸列表
.T
转置
数据合并
pd.concat(objs, axis, join, keys)
轴向拼接
pd.merge(left, right, how, on)
.join()
索引对齐合并
数据分组与聚合
分组操作
.groupby(by)
支持标签、表达式、函数、列表、字典、Series、数组
聚合操作
聚合函数
sum()/count()/mean()/median() min()/max()/std()/var()/size() prod()/sem()......核心函数
聚合器
.agg(func)
多函数聚合
.transform(func)
组内转换
.filter(func)
组过滤
数据统计与分析
综合描述
极值分析
.max()/.min()
.idxmax()/.idxmin()
.ptp()
分布分析
.mean()/.median()/.mode()/.quantile()
.std()/.var()/.sem()
.skew()/.kurt()
.value_counts(), unique(), nunique()
.rank()
相 关 性
.corr()
相关系数矩阵
.cov()
协方差矩阵
时间序列处理
窗口计算
.rolling(window).mean()/.std()
移动窗口
.expanding(min_periods).sum()
扩展窗口
时间偏移
.shift()
滞后/领先
.diff()
差分
.pct_change()
百分比变化
重 采 样
.resample('M').mean()
配色方案
#0e3650
主 色
#1f77b4
#e1f3ff
#F5F5F5
#fff9eb
#FFD166
强调色
#366382
大标题
制图人 | 咖啡喵 制图时间 | 2023.3.18 制图软件 | MindMaster
一级标题
关键词
标注
子主题
金句