导图社区 浅谈Numpy和Pandas
包含一种多维数组对象、通⽤函数:快速的元素级数组函数、利⽤数组进⾏数据处理、线性代数、伪随机数生成学等等。
编辑于2021-10-25 20:59:38🔍 **MySQL 多表查询全解析,破解数据关联的奥秘!** 🚀 当单表查询无法满足需求,多表查询便成为数据库开发的核心技能。本思维导图全面解析 **MySQL 多表查询技巧**,助你轻松驾驭复杂数据关联。
MySQL 排序与分页:让数据呈现更高效! 在数据库查询中,数据排序和分页是提升查询效率与用户体验的关键。本思维导图直观展示 ORDER BY 排序技巧和 LIMIT 分页策略,帮助你轻松掌握: 🔹 排序数据——多列排序、ASC/DESC 关键字、优化查询性能 🔹 分页查询——LIMIT、OFFSET 机制,让大数据查询更流畅 🔹 性能优化——避免常见的分页陷阱,让查询又快又准 💡 一张图秒懂排序与分页原理,助你写出高效 SQL,畅游数据世界!快来探索吧! 🎯✨
MySQL运算符全解析,轻松掌握数据计算! 在SQL世界里,运算符是数据处理的魔法工具!本思维导图系统梳理了 MySQL运算符的五大核心类别: ➊ 算术运算符 ——数值计算,轻松驾驭数据运算! ➋ 比较运算符 ——数据比对,精准筛选目标信息! ➌ 逻辑运算符 ——多条件查询,让SQL更智能! ➍ 位运算符 ——进阶数据处理,掌握二进制操作! ➎ 运算符优先级 ——避免计算混乱,SQL执行更高效! 🌟 一张图快速掌握MySQL运算符,让你的查询更精准、逻辑更清晰、性能更高效! 🚀 快来探索吧!✨
社区模板帮助中心,点此进入>>
🔍 **MySQL 多表查询全解析,破解数据关联的奥秘!** 🚀 当单表查询无法满足需求,多表查询便成为数据库开发的核心技能。本思维导图全面解析 **MySQL 多表查询技巧**,助你轻松驾驭复杂数据关联。
MySQL 排序与分页:让数据呈现更高效! 在数据库查询中,数据排序和分页是提升查询效率与用户体验的关键。本思维导图直观展示 ORDER BY 排序技巧和 LIMIT 分页策略,帮助你轻松掌握: 🔹 排序数据——多列排序、ASC/DESC 关键字、优化查询性能 🔹 分页查询——LIMIT、OFFSET 机制,让大数据查询更流畅 🔹 性能优化——避免常见的分页陷阱,让查询又快又准 💡 一张图秒懂排序与分页原理,助你写出高效 SQL,畅游数据世界!快来探索吧! 🎯✨
MySQL运算符全解析,轻松掌握数据计算! 在SQL世界里,运算符是数据处理的魔法工具!本思维导图系统梳理了 MySQL运算符的五大核心类别: ➊ 算术运算符 ——数值计算,轻松驾驭数据运算! ➋ 比较运算符 ——数据比对,精准筛选目标信息! ➌ 逻辑运算符 ——多条件查询,让SQL更智能! ➍ 位运算符 ——进阶数据处理,掌握二进制操作! ➎ 运算符优先级 ——避免计算混乱,SQL执行更高效! 🌟 一张图快速掌握MySQL运算符,让你的查询更精准、逻辑更清晰、性能更高效! 🚀 快来探索吧!✨
浅谈Numpy和Pandas
NumPy基础
ndarray:一种多维数组对象
创建ndarray
ndarray的数据类型(dtype)
可以通过ndarray的astype方法明确地将一个数组从一个dtype 转换成另一个dtype
NumPy数组的运算
NumPy用户称其为矢量化(vectorization)
大小相等的数组之间的任何算术运算都会将运算应用到元素级
数组与标量的算术运算会将标量值传播到各个元素
大小相同的数组之间的比较会生成布尔值数组
不同大小的数组之间的运算叫做广播(broadcasting)
索引
数组切片是原始数组的视图。这意味着数据不会被复制,视图上的任何修改都会 直接反映到源数组上。
数组转置和轴对换
转置是重塑的⼀种特殊形式,它返回的是源数据的视图(不会进 ⾏任何复制操作
.T
.transpose()
.swapaxes()
通⽤函数:快速的元素级数组函数
通⽤函数(即ufunc)是⼀种对ndarray中的数据执⾏元素级运算 的函数。你可以将其看做简单函数(接受⼀个或多个标量值,并 产⽣⼀个或多个标量值)的⽮量化包装器
一元ufunc
二元ufunc
利⽤数组进⾏数据处理
NumPy数组使你可以将许多种数据处理任务表述为简洁的数组 表达式(否则需要编写循环)。⽤数组表达式代替循环的做法, 通常被称为⽮量化
numpy.where函数是三元表达式x if condition else y的⽮量化版 本
基本数组统计⽅法
any⽤于测试数组中是否存在⼀个或多个True, ⽽all则检查数组中所有值是否都是True
顶级⽅法np.sort返回的是数组的已排序副本,⽽就地排序则会修 改数组本身
NumPy的集合函数
线性代数
伪随机数生成
Pandas入门
pandas的数据结构
Series是⼀种类似于⼀维数组的对象,它由⼀组数据(各种 NumPy数据类型)以及⼀组与之相关的数据标签(即索引)组 成
DataFrame是⼀个表格型的数据结构,它含有⼀组有序的列,每 列可以是不同的值类型(数值、字符串、布尔值等)。 DataFrame既有⾏索引也有列索引,它可以被看做由Series组成 的字典(共⽤同⼀个索引)。DataFrame中的数据是以⼀个或多 个⼆维块存放的(⽽不是列表、字典或别的⼀维数据结构)
索引对象
pandas的索引对象负责管理轴标签和其他元数据(⽐如轴名称 等)
基本功能
重新索引reindex
丢弃指定轴上的项drop
⽤轴标签(loc)或整数索引(iloc)
Series和DataFrame的算术⽅法
函数应⽤和映射
NumPy的ufuncs(元素级数组⽅法)也可⽤于操作pandas对 象
DataFrame的apply⽅法:将函数应⽤到由各列或⾏所形成的⼀维数 组上
DataFrame的applymap方法:将函数应用到元素级
Series有⼀个⽤于应⽤元素级函数 的map⽅法
排序和排名
sort_index()
对⾏或列索引进⾏排序
sort_values()
根据值排序
将⼀个或多个列的名字传递给sort_values的by选项, 即可根据一个或多个列中的值进行排序
rank()
默认情况下,rank是通过“为各 组分配⼀个平均排名”的⽅式破坏平级关系的
也可以根据值在原数据中出现的顺序给出排名: obj.rank(method='first')
汇总和计算描述统计
pandas对象拥有⼀组常⽤的数学和统计⽅法。它们⼤部分都属 于约简和汇总统计,⽤于从Series中提取单个值(如sum或 mean)或从DataFrame的⾏或列中提取⼀个Series。
约简方法的选项
描述统计方法
相关系数与协⽅差
corr()、cov()
Series的corr⽅法⽤于计算两个Series中重叠的、⾮NA的、按索 引对⻬的值的相关系数 returns['MSFT'].corr(returns['IBM'])
与此类似,cov⽤于计算协⽅差: returns['MSFT'].cov(returns['IBM'])
DataFrame的corr和cov⽅法将以DataFrame的形式 分别返回完整的相关系数或协⽅差矩阵
corrwith()
利⽤DataFrame的corrwith⽅法,你可以计算其列或⾏跟另⼀个 Series或DataFrame之间的相关系数
传⼊⼀个Series将会返回⼀个相关系数值Series(针对各列进⾏计算)
传⼊⼀个DataFrame则会计算按列名配对的相关系数
唯⼀值、值计数、成员资格⽅法