导图社区 pandas 数据结构
Pandas是基于NumPy创建的库,简单介绍了pandas的数据结构(DataFrame、Series)及相互关系
编辑于2022-06-06 00:06:13当运行程序时,数据会以变量、序列或者对象的形式,在程序中临时存储。但当程序运行结束之后,数据也随之消失。如果我们想长期保存数据,那么就需要将数据存储到磁盘文件中,这就需要通过Python读写文件,即I/O操作。I/O操作有三步:1、打开文件;2、文件读写;3、关闭文件(或者编写成with语句)。 本篇思维导图,即是围绕而操作的核心——文件对象(file_obj)来展开讲解,分为2个部分:一、file_obj的创建(open函数);二、file_obj的方法调用(读取文件、写入文件、文件指针以及最后的关闭文件)。 希望通过本篇思维导图,能帮助你对使用Python进行文件读写有更深的理解与认识!
Python数据类型,从整体来看,以数字、文本为基础,用列表、字典、元组、集合作为容器;以性质划分,又分为可变与不可变数据。 本篇思维导图为大家讲解的即是Python中作为基础数据的数字(包含整型、浮点型、复数)。 数字本身的内容不多,重点在其有多样的表现形式。然后,对数字的相关处理方式(运算 函数)。 值得注意的是,整型就是整数,但是,浮点型不等于小数,也表达不了分数。所有针对于小数及分数的运算,补充了Decimal类、Praction类的讲解部分。 最后,对于数字运算有重要关系的math模块,将相关的函数及特殊值进行汇总,希望对大家在用到数学运算的时侯带来帮助。 本篇导图逻辑清晰、内容完整,希望能对想要深入学习Python的您带来帮助!
Python数据类型,从整体来看,以数字、文本为基础,用列表、字典、元组、集合作为容器;以性质划分,又分为可变与不可变数据。 本篇思维导图为大家讲解的即是Python中作为基础数据的文本(即字符串),以“时间顺序”将内容拆解为"创建、引用、操作、输出"四个部分。 1、字符串由引号直接创建,一些特殊的内容需要用到转义字符;当然,还需特别注意引号前的字母,对字符内容存在一定的影响; 2、字符串的引用,同列表一样,即索引与切片;但其属于不可变数据类型,不支持就地更改; 3、字符串的操作按照操作方式,分为“运算、函数、方法”三种方式,其字符串的方法非常丰富,特别将方法进行详细的梳理归纳,以便我们能更好的使用。 4、字符串输出部分,重点讲格式化输出,并对字符呈现起着关键作用的spec字段详细讲解,以便我们的文字内容能够更好的呈现。 本篇导图逻辑清晰、内容完整,希望能对想要深入学习Python的您带来帮助!
社区模板帮助中心,点此进入>>
当运行程序时,数据会以变量、序列或者对象的形式,在程序中临时存储。但当程序运行结束之后,数据也随之消失。如果我们想长期保存数据,那么就需要将数据存储到磁盘文件中,这就需要通过Python读写文件,即I/O操作。I/O操作有三步:1、打开文件;2、文件读写;3、关闭文件(或者编写成with语句)。 本篇思维导图,即是围绕而操作的核心——文件对象(file_obj)来展开讲解,分为2个部分:一、file_obj的创建(open函数);二、file_obj的方法调用(读取文件、写入文件、文件指针以及最后的关闭文件)。 希望通过本篇思维导图,能帮助你对使用Python进行文件读写有更深的理解与认识!
Python数据类型,从整体来看,以数字、文本为基础,用列表、字典、元组、集合作为容器;以性质划分,又分为可变与不可变数据。 本篇思维导图为大家讲解的即是Python中作为基础数据的数字(包含整型、浮点型、复数)。 数字本身的内容不多,重点在其有多样的表现形式。然后,对数字的相关处理方式(运算 函数)。 值得注意的是,整型就是整数,但是,浮点型不等于小数,也表达不了分数。所有针对于小数及分数的运算,补充了Decimal类、Praction类的讲解部分。 最后,对于数字运算有重要关系的math模块,将相关的函数及特殊值进行汇总,希望对大家在用到数学运算的时侯带来帮助。 本篇导图逻辑清晰、内容完整,希望能对想要深入学习Python的您带来帮助!
Python数据类型,从整体来看,以数字、文本为基础,用列表、字典、元组、集合作为容器;以性质划分,又分为可变与不可变数据。 本篇思维导图为大家讲解的即是Python中作为基础数据的文本(即字符串),以“时间顺序”将内容拆解为"创建、引用、操作、输出"四个部分。 1、字符串由引号直接创建,一些特殊的内容需要用到转义字符;当然,还需特别注意引号前的字母,对字符内容存在一定的影响; 2、字符串的引用,同列表一样,即索引与切片;但其属于不可变数据类型,不支持就地更改; 3、字符串的操作按照操作方式,分为“运算、函数、方法”三种方式,其字符串的方法非常丰富,特别将方法进行详细的梳理归纳,以便我们能更好的使用。 4、字符串输出部分,重点讲格式化输出,并对字符呈现起着关键作用的spec字段详细讲解,以便我们的文字内容能够更好的呈现。 本篇导图逻辑清晰、内容完整,希望能对想要深入学习Python的您带来帮助!
Pandas 数据结构
DataFrame是Series的容器
Series:带标签的,一维数组 DataFrame:带标签的,大小可变的,二维异构表格
Series
1. Series创建方式
1||| 使用列表和元组
data=list/tuple
2||| 使用ndarray
data=ndarray
3||| 使用字典
data=dict
key:索引
value:数据
4||| 使用标量
data=value
s=pd.Series(data[,index=index,name=name])
data
Python对象、ndarray、一个标量(定值)
index
指定索引,list,默认[0,1,2,...,len(data)-1]
name
指定Series名称
dtype
指定数据类型
2. Series对象的描述
Series对象的属性
shape
形状
size
大小
index
索引标签
values
值(ndarray)
Series对象的方法
head(x)
获取对象前面指定个数(x)的数据
tail(x)
获取对象后面指定个数(x)的数据
DataFrame
1. DataFrame创建方式
1||| 字典
键:列名
值:具体数据(列表/元组)
2||| Series 组成的字典
键:列名
值:Series
3||| 字典组成的列表
每个字典是一行数据
4||| Series 生成
一个Series生成只有一列的DataFrame
df.DataFrame(data=None,index=None,columns=None)
data
具体数据,结构化或同构的ndarray、可迭代对象、字典或DataFrame
index
指定索引,默认RangeIndex(0,1,2,...)
columns
表头(列标签),默认RangeIndex(0,1,2,...)
dtype
指定数据类型
5||| 其他方法
pd.DataFrame.from_dict(dict)
pd.DataFrame.from_records(list\dict\ndarray)
pd.json_normalize(df.col)
pd.col.apply(pd.Series)
2. DataFrame对象的描述
df.info()
使用info方法获取df的信息
对象的类型、行索引、列索引信息、每列数据的列标签、非缺失值个数和数据类型、占用内存大小等
df.dtypes
使用dtypes属性获取df每列数据的类型
df.shape
使用shape属性,获取df的行数和列数
以元组形式返回
len(df)
使用len函数,获取df的行数和列数
len(df)
行数
len(df.columns)
列数
df.index
使用index属性,获取df的行索引标签
df.columns
使用columns属性,获取df的列索引标签
df.values
使用values属性,获取df的值
df.head(n)
使用head方法,获取前n行数据,默认n=5
df.tail(n)
使用tail方法,获取后n行数据,默认n=5
df.describe()
使用describe方法,获取df每列数据的描述统计量
包括数据个数、均值、标准差、最小值、25%分位数、中值、75%分位数、最大值等
NumPy
NumPy,是Python的一个高性能矩阵运算的科学计算库
NumPy的两个基本对象
ndarray
存储数据的多维数组
ufunc
对数组进行处理的函数
DataFrame为一个字典
键,表头
值,数据条(Series)