导图社区 Python文件和数据格式化
本导图主要介绍了Python中文件的使用、自动绘图、一维和二维数据的格式化和处理、wordcloud库的使用,导图内容来源于中国大学MOOC—Python语言程序设计(北京理工大学),配合课程使用效果更好。
编辑于2021-06-25 20:34:11本导图为作者备考中级经济师(人力资源)过程中形成的学习笔记,已取得人力资源管理师证。中级经济专业技术资格考试设《经济基础知识》和《专业知识和实务》两个科目,题型均为客观题。《专业知识和实务》为专业科目,分为工商管理、农业经济、财政税收、金融、保险、运输经济、人力资源管理、旅游经济、建筑与房地产经济、知识产权10个专业类别;《经济基础知识》为公共科目,由经济学基础、财政、货币与金融、法律、会计、统计六个部分组成。
本导图为中级经济师考试科目《经济基础知识》的统计部分,主要包括统计与数据科学、描述统计、抽样统计、回归分析、时间序列分析。
本导图为中级经济师考试科目《经济基础知识》的货币与金融部分,主要包括货币供求与货币均衡、中央银行与货币政策、商业银行与金融市场、金融风险与金融监管、对外金融关系与政策。
社区模板帮助中心,点此进入>>
本导图为作者备考中级经济师(人力资源)过程中形成的学习笔记,已取得人力资源管理师证。中级经济专业技术资格考试设《经济基础知识》和《专业知识和实务》两个科目,题型均为客观题。《专业知识和实务》为专业科目,分为工商管理、农业经济、财政税收、金融、保险、运输经济、人力资源管理、旅游经济、建筑与房地产经济、知识产权10个专业类别;《经济基础知识》为公共科目,由经济学基础、财政、货币与金融、法律、会计、统计六个部分组成。
本导图为中级经济师考试科目《经济基础知识》的统计部分,主要包括统计与数据科学、描述统计、抽样统计、回归分析、时间序列分析。
本导图为中级经济师考试科目《经济基础知识》的货币与金融部分,主要包括货币供求与货币均衡、中央银行与货币政策、商业银行与金融市场、金融风险与金融监管、对外金融关系与政策。
文件和数据格式化
本导图主要介绍了Python中文件的使用、自动绘图、一维和二维数据的格式化和处理、wordcloud库的使用,导图内容来源于中国大学MOOC—Python语言程序设计(北京理工大学),配合课程使用效果更好。
文件的使用
文件的类型
文本文件
.txt文件、.py文件
二进制文件
.png文件、.avi文件
文件的打开和关闭
<变量名>=open(<文件名>,<打开模式>
<文件名>: 文件路径和名称,源文件同目录直接输文件名 输入路径时需将\改为/,例如:F:\python\代码库\hamlet.txt→F:/python/代码库/hamlet.txt <打开模式>: p p
变量名.close()
文件内容的读取
f.read(size)
默认读入全部内容,给出参数则读入前size长度
f.readline(size)
默认读入一行内容,给出参数则读入该行前size长度
f.readlines(hint)
默认读入所有行,一行为一个元素,组成一个列表 给出参数,读入前hint行
数据的文件写入
f.write(s)
写入一个字符串或字节流
f.writelines(lines)
写入一个元素均为字符串的列表
f.seek(offset)
改变当前文件操作指针的位置 offset: 0:开头 1:当前位置 2:结尾
自动轨迹绘制
自动化思维
数据和功能分离
接口文件
程序和数据之间的一种规范,用于解析数据文件
数据文件
以接口文件定义的格式存储的数据
代码
p
一维数据的格式化和处理
一维数据的表示
有序:列表
无序:集合
一维数据的存储
空格分隔
逗号分隔
其他方式
一维数据的处理
读数据
从空格分隔的文件中读入数据 中国 美国 日本 德国 法国 英国 意大利 txt=open(f.txt) ls=txt.split() f.close() 从特殊符号分隔的文件中读入数据 中国$美国$日本$德国$法国$英国$意大利 txt=open(f.txt) ls=txt.split("$") f.close()
写数据
采用空格分隔方式将数据写入文件 ls=['中国','美国','日本'] f=open(f.txt,'w') f.write(' '.join(ls) f.close() 采用特殊符号分隔方式将数据写入文件 ls=['中国','美国','日本'] f=open(f.txt,'w') f.write('$'.join(ls) f.close()
二维数据的格式化和处理
二维数据的表示
二维列表
CSV格式与二维数据存储
CSV数据存储格式
国际通用的一二维数据存储格式,扩展名为.csv CSV:Comma-Separated Values,采用逗号分隔 每行一个一维数据 如果某个元素缺失,逗号仍要保留
二维数据的存储
按行存或者按列存都可以 索引习惯为先行后列:ls[row][column] 根据一般习惯,外层列表每个元素是一行
二维数据的处理
读数据
从CSV格式的文件中读入数据 fo=open(f.txt) ls=[] for line in fo: line=line.replace("\n","") ls.append(line.split(",")) fo.close()
写数据
将数据写入CSV格式的文件 ls=[[],[],[]] f=open(fname,'w') for item in ls: f.write(','.join(item)+'\n') f.close()
二维数据的逐一处理
ls=[[1,2],[3,4],[5,6]] for row in ls: for colum in row: print(colum)
wordcloud库的使用
wordcloud库概述
优秀的词云展示第三方库
wordcloud库的安装
pip install wordcloud
wordcloud库使用
配置对象参数:w=wordcloud.WordCloud()
width:生成词云图片的宽度,默认400像素 height:生成词云图片的高度,默认200像素 min_font_size:词云中的最小字号,默认4号 max_font_size:词云中的最大字号,根据高度自动调节 font_step:词云中字号的步进间隔,默认为1 font_path:字体文件的途径,默认None max_words:词云显示的最大单词数量,默认200 stop_words:词云中不显示的单词列表 mask:词云形状,默认长方形 background_color:词云图片背景色,默认黑色
加载词云文本:w.generate()
输出词云文件:w.to_file()
wordcloud库的功能
1、分隔:以空格分隔单词 2、统计:统计单词出现次数并过滤 3、字体:根据统计配置自豪 4、布局:颜色环境尺寸
政府工作报告词云
p