导图社区 DataFrame核心知识
这是一篇关于DataFrame核心知识的思维导图,主要内容包括:数据分析,数据清洗,高级功能,数据操作,基本属性,创建DataFrame。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
DataFrame核心知识
数据分析
统计分析
基础统计:df.mean(), df.max(), df.min()
高级统计:df.std(), df.median(), df.corr()
计数统计:df.count(), df.nunique()
数据探索
df['列'].unique()
df['列'].value_counts()
df.quantile([0.25,0.5,0.75])
数据清洗
空值处理
检测空值:df.isnull()
空值统计:df.isnull().sum()
处理空值:df.dropna() 或 df.fillna(值)
重复值处理
检测重复:df.duplicated()
删除重复:df.drop_duplicates()
唯一性检查:df['列'].is_unique
数据类型
类型检查:df.dtypes
类型转换:df['列'].astype(类型)
高级功能
分组:df.groupby('列名')
聚合:.mean(), .sum(), .count()
多列分组:df.groupby(['列1','列2'])
读取数据:pd.read_csv(), pd.read_excel()
保存数据:df.to_csv(), df.to_excel()
数据操作
列操作
选择列
df['列名'] 或 df[['列1','列2']]
添加列
df['新列'] = 值
删除列
df.drop('列名', axis=1)
重命名
df.rename(columns={'旧名':'新名'})
行操作
选择行
df.loc[索引] 或 df.iloc[位置]
删除行
df.drop(索引)
排序
df.sort_values('列名')
筛选
df[df['列'] > 值]
基本属性
核心属性
df.shape:数据维度 (行数, 列数)
df.index:行索引
df.columns:列名称
df.dtypes:列数据类型
df.values:原始数据数组
信息查看
df.info():详细数据信息
df.describe():统计摘要
df.head(n):前n行数据
df.tail(n):后n行数据
创建DataFrame
基础创建方法
字典创建
df = pd.DataFrame({'列名':[值列表]})
列表创建
df = pd.DataFrame(二维列表, columns=['列名'])
数组创建
df = pd.DataFrame(numpy数组)
高级创建选项
自定义索引
index=['a','b','c']
自定义列顺序
columns=['列1','列2']
特殊索引
日期索引、多层索引