导图社区 数据与大数据
上海高一信息--数据与大数据,数据是对事物描述的记录,信息学奠基人克劳德·艾尔伍德·香农认为“信息是能是用来消除不确定性的东西”。
编辑于2023-08-26 17:58:10 上海数据与大数据
数据、信息与知识
感知数据
数据的概念
数据是对事物描述的记录
数据是可加工、可处理的
数据的价值
认识信息
信息的概念
信息学奠基人克劳德·艾尔伍德·香农认为“信息是能是用来消除不确定性的东西”
信息管理专家F.W.霍顿将信息定义为“信息是为了满足用户决策的需要而经过加工处理的数据”
合理应用信息
遵守信息安全法规,负责任地使用信息
敏锐感知周围世界,正确获取信息
具备信息辨别能力,有效甄别信息
信息的特征
信息可以传播和存储
信息的价值是相对的
信息可以被共享
信息具有时效性
学习知识
数据、信息与知识的 关系
数据是信息的载体,信息是数据的内容
知识(认识和经验的总和)分为
一般知识
科学知识
数据→信息→知识
体验数字化学习
数字化与编码
进位计数制及其转换
进位计数制
数码
用来表示某种进位计数制的一组符号
基数
可以使用的数码个数
位权
数码在不同数位上的倍率值
不同进位计数制的相互转换
方法(十进制整数转化为二进制数)
除以二反向取余
数据的存储单位
比特是计算机中最小的数据存储单位,字节是计算机中信息组织和存储的基本数据存储单位
1B=8bit
bit<Byte<KB<MB<GB<TB<PB<EB……(1024进)
数字化
数字化是计算机处理信息的基础 信息数字化:把各种各样的信息用二进制数来表示的过程
模拟信号和数字信号
模拟量是连续的
数字量是离散的
模拟信号的数字化过程
采样
量化
编码
编程
编码是为了方便信息的存储、检索和使用而规定的符号系统。 编码的过程是将信息按照一定的规则进行变换。
字符编码
ASCII码
国际上普遍采用的一种英文字符编码
七位二进制编码
定义了128个字符
10个阿拉伯数字
26个大写英文字母
26个小写英文字母
33个其他符号
33个控制符号
汉字编码
主要使用的汉字编码标准是GB18030-2005
支持单字节、双字节和四字节的汉字编码
大部分常用汉字采用双字节编码
输入码
利用键盘输入汉字时, 还需要通过另外设计的汉字输入码来实现
机内码
可以使用字母、数字或符号来对汉字进行编码
多种形式
多种形式以汉字的字音为主的音码
汉字的字形为主的五笔字型码
字形码
输出汉字时,还会使用汉字字形码
字库中存储的汉字字形的数字化信息
用于汉字的显示和打印输出
表示方式
点阵方式
矢量方式
Unicode字符集和编码方案
Unicode字符集
计算机科学领域里的一项业界标准
对世界上大部分的文字系统进行了整理、编码
避免由于编码冲突而产生的乱码问题
使得计算机可以用更简单的方式来处理和呈现文字码
分为17组(平面),每组含有65536个码位,共1114112个
编码方案
(主要使用)UTF-8、UTF-16、UTF-32
声音编码
采样
每隔一段时间在声音的模拟信号上采集一个样本数值
间隔越短→频率越高→数据越多→表示越精确→声音保真度越高
量化
用二进制数值表示采样所得到的幅度值的过程
量化等级
等级越多→位数越多→精度越高→误差越小→音质越有保证
编码
通过采样和量化,对获得的二进制数进行编玛后,就可以将声音的顺拟信号转换成二进制代码表示的数据。
存储
未经压缩的音频文件的数据存储量
数据存储量=采样频率×量化位数×声道数÷8×持续秒数(字节)
通常,未经压缩的数字音乐会被保存为WAV文件格式
图像编码
概念
位图
由纵横排列的像素点组成的图像
图像分辨率
水平方向上的像素数量乘以垂直方向上的像素数量
分类
BMP
未压缩的位图图像
JPG
压缩的位图图像
采样
按一定的空间间隔从左到右、自上而下提取画面信息, 将图像在空间上转换成若干个像素点每个像素点呈现不同颜色。
量化
用若干位二进制数表示采样得到的每个像素点的颜色。
颜色深度(位深度)
记录每个像素点的颜色所需的二进制数的位数
颜色深度越大→显示的图像色彩越丰富→画面越自然、逼真
颜色数=2**位深度
编码
按一定的方法表示该图像的二进制序列
RGB颜色模型
三原色光模式三种原色各分8比特
每一种原色的强度可以用0~255之间的整数来表示
可以组合成1677216种颜色
存储
未经压缩的位图图像的数据存储量=图像分辨率×颜色深度÷8(字节)
数据压缩
本质:再次编码
概念
采用特殊的编码方式处理数据,使数据占用的存储空间相对减少,以便存储和传输。
方法
无损压缩
概念
对压缩后的数据进行还原后,得到的数据与压缩前完全相同
工具
rar
zip
应用
程序(数据)
文档(数据)
图像
视频
有损压缩
概念
会损失一定的信息,压缩后的数据无法还原到与压缩前一致
工具
格式工厂
JPEG(图像数据压缩格式)
MP3(音频数据压缩格式)
MPEG(视频数据压缩格式)等
应用
图像
视频
大数据及其作用与价值
理解大数据
数据规模大
数据类型多
处理速度快
价值密度低
大数据处理过程
数据挖掘应用
数据预处理
数据采集
数据分析
大数据的作用及社会影响
大数据的作用
大数据对社会发展的影响