导图社区 Python数据分析思维导图
数据处理包括数据查看,数据清洗操作,数据整理三个部分。导图详细的阐述了三个部分包括的内容。感兴趣的小伙伴可以下载收藏。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
数据处理
数据查看
数据读取并赋值对象(DataFrame): 变量名 = pd.read_csv(路径,encoding='utf-8')
查看对象信息: 对象 . info( )
查看对象描述: 对象 . describe( )
查看对象前后几行信息: 对象 . head( );对象 . tail( )
查看处理后的对象: 对象 = 对象 . 操作( )
数据清洗操作
空值
查看数据信息:对象 . info( )
查看对象中所有空值:对象 . isna( )
子主题
删除对象中的空值:对象 . dropna( )
删除指定列空值并查看:对象 = 对象[ '列名' ] . dropna( )
重复值
查看重复行的索引:对象 . duplicated( )
查看重复数据:df [ df . duplicated( ) ]
删除重复行并查看对象: df = df . drop_duplicates( )
异常值(布尔索引)
指定列的数值范围保留(例:保留对象中指定列的值大于200的数据:df = df [ df [ '列名' ] > 200 ]
数据整理
日期
添加列
数据导入
索引重置
列名 重置
行 索引重置
值的处理
四舍五入
替换
数据集整理
分组聚合
数据集内值的操作
agg(func)
排序
数据分析