导图社区 A多媒体技术
江苏专转本计算机大类复习导图,汇总了多媒体技术、文本与文本处理、图像与图形及应用、波形声音的获取与播放、数字视频及应用、流媒体技术的内容,欢迎查看。
编辑于2023-03-24 12:04:43 江苏省A多媒体技术
多媒体技术
文本与文本处理
文本文件的类型
按照它们是否具有排版格式
简单文本
几乎不包含任何其它的格式信息和结构信息,文件后缀名:.txt
手机短消息使用的就是简单文本
丰富格式文本
组成
正文
标记
标记语言
普通
RTF
网页
HTML(超文本标记语言)
Windows中的记事本也可以编辑HTML文件
使用不同的标签来丰富显示格式
XML(可扩展的标记语言)
举例
DOC文件
HTML文件
PDF文件
目前已经成为ISO 32000国际标准,并被批准为我国用于长期保存的电子文档格式的国家标准
RTF文件
HIP文件
常见处理丰富格式的文本软件
word,wps,Adobe Acrobat
不同的文字处理软件使用的标记语言不同
根据文本内容的组织方式
线性文本
超文本
采用网状结构来组织信息,起点位置称为链源,目的地称为链宿
书签是链源所在文本内部某个地方的标记
典型代表
Windows中的“帮助”文件
文本块之间由指针进行连接
文本块之间的关系是非线性的
超文本中的节点不可以是程序
在互联网上,可以通过网页来获得资源,是一种资源共享方式,信息通常以超文本方式进行组织
超媒体
采用非线性网状结构对块状多媒体信息进行组织和管理
超文本和超媒体组织结构一样,但所描述的对象是不同的
文本处理
类别
字数统计
文语转换
文摘生成
文本检索
关键词检索
全文检索
允许用户对文本中所包含的字或词进行查询(查全率高)
用于web信息检索的搜索引擎大多采用全文检索,使用rboot软件遍历web上的信息资源
如Google、Yahoo、天网、搜狐和百度等
文本在计算机中的处理过程
输入(输入码输入计算机)→存储(机内码存储)→编辑(word,wps 等软件)→显示(字形码显示)
汉字在计算机中的存储一定是机内码
微软公司的Frontpage是一种文字处理软件,他不仅可以对字体段落进行格式编排,而且能够定义超链
面向电子出版的最流行的软件是美国Adobe公司的Acrobat,它使用PDF格式
文本输入方法
输入字符的方法
键盘输入(人工输入)
汉字输入编码方案
数字编码
如电报码,区位码
区位码无重码
有重码的数字编码
五笔字型输入法
智能拼音输入法
自然码输入法
字形编码
重码少,输入速度较快
如五笔字形、郑码和表形码
字音编码
如智能ABC、微软拼音、紫光拼音和搜狗拼音
形音编码
吸取字音和字形的优点,不易掌握
非键盘输入
联机手写输入(人工输入)
语音输入(人工输入)
光学字符识别(自动识别输入)
条形码、磁卡、IC卡、RFID识别(自动识别输入)
文本的表示与字符编码
常用西文字符的ASCII码(中文名为美国信息交换标准码,大小写字母相差32D)
SPACE空格键(SP)——ASCII码值为32
ENTER回车键(EN)——ASCII码值为13
ASCII码中不同字符所对应的ASCII码值的十进制数值由小到大(由前到后)排序
数字<大写字母<小写字母
ASCII码的字母表示范围
大写字母:A~Z(65~90)
小写字母:a~z(97~122)
数字:0~9(48~57)
汉字的编码
GBK汉字内码扩充规范
双字节编码,共有21003个汉字和883个图形符号,字节的最高位不均为一
1995年发布
简体和繁体汉字在同一个字符集中
在GB2312基础上发行,向下兼容GB2312
支持繁体汉字
GB2312汉字编码
双字节编码,按汉字使用频率把汉字分成2个等级
1980年发布
该标准包括6763个简体汉字和682个非汉字字符
一级汉字:按汉字拼音排列,共3755个
二级汉字:按偏旁部首排列,共3008个
GB2312区位码构成一个二维平面,分成94行和94列,行号称为区号,列号称为位号
区号:1~94
位号:1~94
在内存中存储汉字,机内码是十六进制编码
机内码=区位码+A0A0H =国标码+8080H
国标码=区位码+2020H
在二进制表示中,汉字机内码双字节,最高位是1,西文字符机内码单字节,最高位是0
汉字字数太少,不支持繁体汉字,与ASCII码不兼容
GB18030汉字编码标准
汉字数目增加到27000多个,收录字符最多
支持繁体汉字
单字节编码表示ASCII字符
双字节编码表示汉字
中文标点符号“。”存储占用2个字节
四字节编码表示UCS/Unicode中的其他字符
GB 18030-2000 收录了27533个汉字
GB 18030-2005 收录了70244个汉字
向下兼容GB2312和GBK
与UCS/Unicode编码标准接轨
GB-18030实质上是UCS/Unicode字符集的另一种编码方案
GB-18030目前已在我国信息处理产品中强制贯彻执行
UCS/Unicode编码标准
Unicode称为“统一码”或“联合码”,能实现全球所有不同语言文字统一编码的国际编码标准
支持繁体汉字
不兼容我国的任何编码标准
分类
UTF-8
单字节编码
在Windows中文版操作系统中通常使用UTF-8来表示和处理文本
应用
Linux
Web
电子邮件
UTF-16
双字节编码
应用
Windows
Mac
Java
港澳台使用的汉字编码标准
CJK统一汉字编码
BIG5(大五码):只支持繁体字,与GB2312等大陆标准不兼容
西文字符的编码
基本的ASCII字符集共有128个字符,包括
96个可打印字符
32个控制字符
每个ASCII字符以1个字节存放(8位存储,最高位为0)
每个ASCII字符使用7个二进制位进行编码(表示)
不同的字符其编码各不相同
文本的编辑处理与文本的展现
字形码的应用
汉字由像素点组成,汉字输出可以是轮廓字,也可以是点阵字
汉字的字形码存放在汉字库文件中
文本展现
过程
先对文本的格式描述进行解释
然后生成文字和图表的印象
最后传送到显示器或打印机输出
展现方式
打印输出
屏幕显示
字库
两种不同的字库
点阵描述
例:16x16点阵的一个汉字字形需要32个字节(16x16/8=32)来存储
轮廓描述
Windows中采用的字形描述方法是轮廓描述
不同的字体对应不同的字库
在同一个字符集下,文本的输出所使用的字库不同
图像与图形及应用
色彩产生
光是一种电磁辐射,光的振幅和波长决定了光的颜色,波长决定了光的色相,振幅决定了光的明暗
色彩模型
RGB(三基色)模型
R代表红色,G代表绿色,B代表蓝色。RGB模型也称为加色模型,白色的R、G、B都为255,黑色的R、G、B都为0,红色的255.0.0,绿色的0.255.0,蓝色的0.0.255
面向硬件
HSB色彩模式
以色相(H)、饱和度(S)和亮度(B)描述颜色的基本特征
饱和度(指颜色的强度或纯度):0%为纯灰色,100%为完全饱和
亮度:指颜色的相对明暗程度
数字图像
数字图像按其生成方法
取样图像(也称点阵图像或位图图像)(简称图像)
如用数码相机拍摄的照片
如用扫描仪扫描的照片
如Windows画图程序绘制的图
取样图像在计算机中表示方法是灰度图用1个矩阵来表示,彩色图像用一组(3个)矩阵来表示
矢量图像(简称图形)
可以转换为取样图像,且矢量图形放大,缩小,旋转均不会失真,矢量图与分辨率无关
图形是由计算机绘制的图像,也称为矢量图形
矢量图占用的存储空间比取样图小
计算机图形能生成多个视图,而计算机图像只能生成一个视图
图像的主要参数
图像分辨率(用水平分辨率×垂直分辨率表示)
图像大小也叫图像分辨率
图像分辨率决定了像素数目
同像素深度和压缩编码情况下,分辨率越高,图像所占存储空间会越大
像素深度:像素深度决定了颜色数
位平面的数目:黑白图和灰度图只有1个位平面(亮度分量),彩色图像有3个或更多的位平面
黑白图用1位二进制表示
灰度图用8位二进制表示
颜色空间的类型
显示器使用的是RGB(红、绿、蓝)模型
图像编辑软件和用户界面使用的是HSB模型
彩色打印机使用的是CMYK(青、品红、黄、黑)模型
彩色电视信号传输时使用的是YUV(亮度、色度)模型
常用的图像获取设备
手机
扫描仪
数码相机
监控摄像头
图像的获取顺序(核心:模拟信号的数字化)
扫描
每个网格称为一个取样点,称为像素
分色
每种基色占1个位平面,非彩色图像(即灰度图像或黑白图)不必进行分色
取样
取样图像在计算机中用矩阵来表示,每个矩阵称为一个位平面,矩阵的行数称为垂直分辨率,矩阵的列数称为水平分辨率
量化:即把模拟量使用数字量来表示(图像数据量=分辨率×像素深度/8),对取样点每个分量的亮度进行A/D转换,使用数字整型量表示
数字图像处理的主要目的
提高图像的视感质量
图像复原与重建
图像分析
图像数据的交换、编码和数据压缩,使能更有效地进行图像的存储和传输
图像的存储、管理、检索以及图像内容与知识产权的保护
常用图像文件格式
JPEG(大多为有损):采用有损压缩算法,算法复杂度适中,在互联网和数码相机中被广泛使用,不支持透明背景,图像文件扩展名是.jpg,是一个静态图像数据压缩编码的国际标准,JPEG图像压缩比可以由用户控制,压缩比越高图像质量越差
GIF(无损):颜色数目不超过256色(像素深度8位),文件特别小,在网页制作中大量使用,文件扩展名是.gif,具有渐进显示功能,适合网络浏览器观看,能支持透明背景和动画,不适合真彩色图片(真彩色图像的像素深度为24位,可表示1600万种颜色)
TIF(无损):大多使用于扫描仪和桌面出版
PNG(无损):主要在互联网上使用,文件扩展名是.png
BMP(无损)
定义
是Windows操作系统下使用的一种标准图像格式,几乎所有Windows应用软件都支持,一个文件一幅图像,可以进行无损压缩,也可不压缩
属于静态图像文件格式,支持单色、16色、256色、真彩色图像
文件扩展名
.bmp
不适合在网页上大范围使用
JPEG 2000
采用小波分析等先进算法,压缩率更高,比JPEG好,更适合网上传输
常用图像处理软件
Word
PowerPoint
PhotoShop
Windows附件中的“画图”软件
数字图像的应用
卫星遥感
地图
气象
天文
交通
可视电话
医疗诊断
显微图像
超声成像
X光成像
DNA分析
CT
工业生产
生产监控
产品检测
CAD技术
通信应用
图像传输
影像传输
机器人视觉
计算机断层摄影(CT)
计算机图形(也称为计算机合成图像)
景物建模的两种方法
几何建模技术
过程建模技术
与景物类型有密切关系,比如树木,花草,烟火,毛发等去找出它们的生成规律,必须要相应算法来描述其形状规律
显卡的核心是绘图处理器(GPU,也叫图形处理器),显卡在绘制过程中起着关键作用
计算机图形的应用
计算机辅助设计和辅助制作(CAD/CAM)
设计绘制电路图(最直接的应用)
计算机动画和计算机艺术
利用计算机生成各种地形图
作战指挥和军事训练
电子出版
图像与图形的区别
图像的打开速度要比图形快
图像的数据量要比图形大
矢量绘图软件
微软公司的Microsoft Visio
Macromedia公司的FreeHand
Autodesk公司的AutoCAD
AutoCAD不是图像编辑软件
Adobe公司的Illustrator
Corel公司的CorelDraw
MS Office中内嵌的绘图软件
Word,Excel的绘图功能
PowerPoint中的绘图功能
计算机绘图的优点
数据量很小
数据量=(水平分辨率x垂直分辨率x像素深度/8)/压缩比
图形质量较高
图像的数据压缩
类型
无损压缩
用压缩后的数据还原出来的图像没有任何误差
例如哈夫曼编码
例如行程长度编码
声音中包含有大量冗余信息体现了无损压缩
有损压缩
用压缩后的数据还原出来的图像有一定的误差
人耳灵敏度有限,允许有一定失真而不易察觉体现了有损压缩
目的
节省存储空间
提高图像的传输速度,减少通信费用
可能性
数字图像中有大量的数据冗余
图像失真
评价压缩编码方法的优劣
重建图像的质量
压缩算法的复杂度
压缩倍数的大小
图形
定义
计算机合成制作的图像称为矢量图形,简称图形
波形声音的获取与播放
数字音频的表示与应用
定义
人耳可听见的声音在信息技术中称为音频信号,简称音频(模拟信号)
音频的频率范围:20HZ~20KHz
语音的取样频率为8KHz~16KHz,音乐的取样频率为40KHz以上
数字音频是一种使用二进制表示的按时间顺序组织的串行比特流
数字音频的主要参数
量化位数
通常为8位、12位或16位
声道数目
注:3.1声道为4声道,以此类推
取样频率
比特率:每秒钟的数据量,也称为码率
未经压缩的数字音频最常用的文件扩展名为“.wav”,压缩后的码率=未压缩时的码率/压缩比
计算机处理的音频
语音:专指人的说话声音,带宽仅为300~3400Hz
全频带声音:如音乐声、风雨声、汽车声等,其带宽可达到20Hz~20kHz
固定电话中使用PCM编码和ADPCM编码
数字音频编辑软件
主要功能
录音
编辑音频
效果处理
音频的格式转换
播放声音
谐波的频率范围称为声音的带宽
常见音频格式
.aac
.wma
.aiff
.amr
模拟声音信号的数字化
数字音频的获取设备
麦克风
将声波转换为电信号,然后由声卡进行数字化
声卡(以数字信号处理器(DSP)为核心)
物理组成
主处理芯片
包括数字信号处理器,MIDI控制,I/O控制等
CODEC芯片
负责多声道取样,A/D与D/A转换,混音处理等
功能
音频的获取与编码
音频的重建与播放
MIDI消息的输入
MIDI音乐的合成
声卡可以完成数字声音的编码和解码
数字声音是一种连续媒体,和视频一样数据量较大
例:Windows中的媒体播放器可以播放MIDI音乐,播放过程中必须借助于安装在声卡上的音乐合成器将其转换为波形信号
音乐合成器
组成
调频合成器
波表合成器
音频的获取设备
手机
数码录音笔
一般仅适用于录制语音
话筒
麦克风
音频信号数字化的过程
取样:取样的目的是把时间上连续的信号(模拟信号)转换成时间上离散的信号(数字信号),取样频率不应低于数字音频信号最高频率的两倍
量化:把每个样本从模拟量转换为数字量(8位和16位整数表示)量化精度越高,声音的保真度越好;反之亦然,采用A/D转换
编码:将所有样本的二进制代码组织在一起并进行数据压缩(声音码率=取样频率×量化位数×声道数Kb/s)
优点
有利于存储和传输
复制时不会产生失真
可以与其他媒体相互结合
数字音频及应用
计算机合成音频
全频带音频
为了保证对频谱很宽的全频道音乐信号采样时不失真,其取样频率应达到40kHz以上
频率范围
20Hz~20KHz
语音和全频带音频采用不同的压缩编码标准进行压缩
波形声音
注:语音是单声道,立体声是双声道
语音带宽更窄,取样频率也更低,立体声反之
音频信号数字化与音箱
音频信号
声音的重建与播放声音的重建是音频数字化的逆过程,分为三个步骤
解码
数模转换(D/A转换)
插值处理
声音的重建是把音频信号中数字形式转换成模拟信号形式,由声卡硬件来完成
音箱
普通音箱:接收的是重建的模拟音频信号
数字音箱:可直接接收数字音频信号,完成声音重建
声音重建
把音频信号从数字信号形式转换成模拟信号形式
数字音频的文件类型及应用
MP3:进行有损的压缩编码,缩短了网络传输的时间,按MPEG-1的层3标准进行编码
MP3是一种全频带声音压缩编码的国际标准
WMA:采用有损压缩方法,压缩比高于MP3
WAV:未压缩数字音频,音质与CD相当。WAV文件是波形声音文件
是由微软公司开发的一种音频流媒体
WAV格式声音可以与MP3声音进行相互转换
FALC、APE、M4A:采用无损压缩,数据量比WAV大约一半,音质保持相同
计算机合成音频类型
计算机合成语音:这个过程称为文语转换(简称TTS)
过程
文本分析
韵律处理
语音合成
应用
文稿校对
语言学习
语音秘书
自动报警
残疾人服务
计算机合成音乐(MIDI)
中文名称:乐器数字接口
三要素
乐器
由PC的声卡提供,声卡带有音源(也称为音乐合成器)
乐谱:使用MIDI音乐描述语言来表示,一首乐曲对应一个MIDI文件(MIDI文件也属于音频文件),其文件扩展名为.mid或.midi,MIDI传输的不是声音信号,而是音符及其控制参数等指令
“演奏员”
指计算机中的媒体播放器
应用
计算机作曲
特点
MIDI文件的数据量小
例:下列文件格式中相同时长的音频数据量最小的是mid A.wav B.wma C.mp3 D.mid
可表示的音乐不够丰富
同一首乐曲在计算机中既可以用MIDI来表示,也可以用WAV波形声音表示
MIDI文件只能合成音乐,不能合成歌曲
MIDI音乐不是一种全频带声音数字化音乐
常见的有损压缩音频
AAC
AC3
WMA
MP3
硬件播放器
MP3播放器
以播放音频为主,也能播放视频
MP4播放器
以播放视频为主,国外叫做PVP或PMP,LCD屏幕较大,价格较贵
平板、智能手机也有自带的视频播放器
数字视频及应用
视频信号的组成
电视画面是一种由于光点在显示屏上自左向右、自上而下不断高速扫描而形成的光栅图像,一般采用隔行扫描方式
特点
内容随时间而变化
视频具有与画面动作同步的伴随声音
视频信息的处理是多媒体技术的核心
数字视频的主要参数
帧频、帧速率
每秒钟显示多少帧图像,单位是fps
帧大小
每帧图像的分辨率,即图像宽度x图像高度(单位:像素)
颜色深度、像素深度
图像中每个像素的二进制数目(单位:bit)
图像扫描方式
逐行扫描
比隔行扫描更稳定,画面更自然
隔行扫描
常见的数字视频文件格式
.mp4
.avi
.flv
由Adobe公司开发的视频编码格式
.mov
.mpg
按照MPEG标准压缩的全运动视频图像文件格式
数字视频的获取设备
视频采集卡(简称视频卡)
例:数字摄像头必须通过视频卡与PC机相连接(✘)
视频卡一般插在PC机的PCI插槽内
数字摄像头
通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机
CCD芯片中像素越多,可拍摄的图像分辨率就越高(无前提条件)
接口
USB
FireWire
脱机获取设备
智能手机
数码相机
数码摄像机
数字视频的信息获取过程
滤波→取样→量化→编码
显示格式
标准清晰电视(SDTV,表示576i)
分辨率为720*576,隔行扫描
帧频为25fps,视频流的比特率为3Mb/s
DVD-Video光盘中的视频大多也是SDTV格式
高清晰电视(HDTV,表示1080i)
分辨率为1920*1080,隔行扫描(1080p是逐行扫描)
帧频为25fps,视频流的比特率约为8Mb/s
数字有线电视中高清频道播放的就是HDTV节目
超高清晰度电视(UHDTV,也称为4K电视)
分辨率为3840*2160,是HDTV的四倍以上
电脑显卡也支持4K显示,就连高端智能手机也能拍摄4K视频
8k(超高清晰度)
分辨率为7680*4320,每秒24p、30p和60p帧
8k的分辨率是4K的4倍,1080P的16倍
10K的分辨率为10240 *4320
分辨率为10240*4320,HDMI2.1标准支持
视频制式
NTSC制(即正交平衡调幅制):又称N制
优点:设备成本低
缺点:容易出现颜色失真、串色
扫描方式
隔行扫描
颜色模型
YIQ
美国,加拿大等西半球国家以及中国的台湾地区,日本,韩国,菲律宾都采用这种制式
PAL制
中国:25帧
美国:30帧
颜色模型
YUV
德国,英国等一些西欧国家以及中国,朝鲜等国家采用这种制式
SECAM制
兼容性不如NTSC制和PAL制
法国,苏联,东欧和中东等约65个国家采用这种制式
制定视频编码标准的组织
国际电信联盟通信标准部(ITU-T),制定的标准以H.26x的形式表示
国际标准化组织/国际电工技术委员会(ISO/IEC),制定的标准以MPEG-x的形式表示
制定视频编码标准的形式
H.261
主要应用:在低速通信网中进行可视电话/视频会议
H.263
主要应用:低码率的视频通信
MPEG-1
MPEG中文简称:动态图像专家组
主要应用:VCD、数码相机、数字摄像机和MP3等
MPEF-1编码层次
层1
编码简单
层2
算法复杂度适中
层3
编码复杂,编码效果最佳
MPEG-2/H.262
主要应用:DVD、卫星电视和数字有线电视等
MPEG-4
MPEG-4 ASP是低频压缩,主要应用于手机,监控,IPTV,MP4
MPEG-4 AVC(H.264)是高频压缩,主要应用于标清视频,蓝光光盘,HDTV,iPad,iPhone
H.264具有在高压缩比的同时还拥有高质量流畅的图像,能很好的在互联网环境和2G、3G和4G等移动通讯网上传输
编码标准与编/解码器(Codec)
同一种编码标准可以有许多不同的Codec产品
Codec可以是硬件(硬件编解码),也可以是软件(软件编解码)
数字视频的应用
可视电话和视频会议
可视电话
静态图像
动态图像
VCD、DVD和蓝光
数字电视、IPTV
数字电视机(简称DTV)接收机的三种形式
数字电视机
传统模式电视机+数字机顶盒
可以接收数字电视信号的PC机
视频点播(VOD)
目前,在互联网上支持视频直播或视频点播,一般采用的都是流媒体技术
使用户可以根据自己的喜好选择收看电视节目,从根本上改变用户被动收看电视的状况
基于C/S模式
视频监控
计算机动画
定义
使用计算机生成一系列内容连续的画面供实时演播的一种技术,它是一种计算机合成的数字视频,而不是用摄像机拍摄的自然视频,25帧/秒
分类
从空间角度
二维动画
三维动画
从动画的形成方式
帧动画
矢量动画
制作过程
描述景物的形状与结构(建模)
确定景物的颜色和材质(纹理)
设置灯光和确定虚拟摄像机的位置(确定位置)
描述场景中物体的运动和摄像机的移动(描述状态)
绘制一系列的图像
输出动画结果
动画制作的软件
加拿大Alias公司的Power animator
加拿大Vertigo公司的Vertigo
法国TDI公司的Explore
荷兰GIG公司的3DGO
美国Autodesk公司和Discreet公司的3dsmax,Animator Studio
互联网动画格式
GIF
Flash
流媒体技术
定义
允许在宽带网上让用户一边下载一边收看(听)音视频连续媒体的技术
代表
微软公司的wmv,ASF
形式
下载存储方式
下载完毕后播放
流式传输方式
边下载边播放
流媒体产品
微软公司的Microsoft Media Player
苹果公司的Quick Time Player
Real公司的RealPlayer
全能播放器
暴风影音
变色龙万能播放器
豪杰超级解霸
应用
视频会议
在线音频广播
实时音乐或视频点播
流媒体通常需要在客户端和服务器之间采用以下四种协议
实时传输协议RTP
实时传输控制协议RTCP
实时流协议RTSP
资源预留协议RSVP
A多媒体技术
多媒体技术
文本与文本处理
文本文件的类型
按照它们是否具有排版格式
简单文本
几乎不包含任何其它的格式信息和结构信息,文件后缀名:.txt
手机短消息使用的就是简单文本
丰富格式文本
组成
正文
标记
标记语言
普通
RTF
网页
HTML(超文本标记语言)
Windows中的记事本也可以编辑HTML文件
使用不同的标签来丰富显示格式
XML(可扩展的标记语言)
举例
DOC文件
HTML文件
PDF文件
目前已经成为ISO 32000国际标准,并被批准为我国用于长期保存的电子文档格式的国家标准
RTF文件
HIP文件
常见处理丰富格式的文本软件
word,wps,Adobe Acrobat
不同的文字处理软件使用的标记语言不同
根据文本内容的组织方式
线性文本
超文本
采用网状结构来组织信息,起点位置称为链源,目的地称为链宿
书签是链源所在文本内部某个地方的标记
典型代表
Windows中的“帮助”文件
文本块之间由指针进行连接
文本块之间的关系是非线性的
超文本中的节点不可以是程序
在互联网上,可以通过网页来获得资源,是一种资源共享方式,信息通常以超文本方式进行组织
超媒体
采用非线性网状结构对块状多媒体信息进行组织和管理
超文本和超媒体组织结构一样,但所描述的对象是不同的
文本处理
类别
字数统计
文语转换
文摘生成
文本检索
关键词检索
全文检索
允许用户对文本中所包含的字或词进行查询(查全率高)
用于web信息检索的搜索引擎大多采用全文检索,使用rboot软件遍历web上的信息资源
如Google、Yahoo、天网、搜狐和百度等
文本在计算机中的处理过程
输入(输入码输入计算机)→存储(机内码存储)→编辑(word,wps 等软件)→显示(字形码显示)
汉字在计算机中的存储一定是机内码
微软公司的Frontpage是一种文字处理软件,他不仅可以对字体段落进行格式编排,而且能够定义超链
面向电子出版的最流行的软件是美国Adobe公司的Acrobat,它使用PDF格式
文本输入方法
输入字符的方法
键盘输入(人工输入)
汉字输入编码方案
数字编码
如电报码,区位码
区位码无重码
有重码的数字编码
五笔字型输入法
智能拼音输入法
自然码输入法
字形编码
重码少,输入速度较快
如五笔字形、郑码和表形码
字音编码
如智能ABC、微软拼音、紫光拼音和搜狗拼音
形音编码
吸取字音和字形的优点,不易掌握
非键盘输入
联机手写输入(人工输入)
语音输入(人工输入)
光学字符识别(自动识别输入)
条形码、磁卡、IC卡、RFID识别(自动识别输入)
文本的表示与字符编码
常用西文字符的ASCII码(中文名为美国信息交换标准码,大小写字母相差32D)
SPACE空格键(SP)——ASCII码值为32
ENTER回车键(EN)——ASCII码值为13
ASCII码中不同字符所对应的ASCII码值的十进制数值由小到大(由前到后)排序
数字<大写字母<小写字母
ASCII码的字母表示范围
大写字母:A~Z(65~90)
小写字母:a~z(97~122)
数字:0~9(48~57)
汉字的编码
GBK汉字内码扩充规范
双字节编码,共有21003个汉字和883个图形符号,字节的最高位不均为一
1995年发布
简体和繁体汉字在同一个字符集中
在GB2312基础上发行,向下兼容GB2312
支持繁体汉字
GB2312汉字编码
双字节编码,按汉字使用频率把汉字分成2个等级
1980年发布
该标准包括6763个简体汉字和682个非汉字字符
一级汉字:按汉字拼音排列,共3755个
二级汉字:按偏旁部首排列,共3008个
GB2312区位码构成一个二维平面,分成94行和94列,行号称为区号,列号称为位号
区号:1~94
位号:1~94
在内存中存储汉字,机内码是十六进制编码
机内码=区位码+A0A0H =国标码+8080H
国标码=区位码+2020H
在二进制表示中,汉字机内码双字节,最高位是1,西文字符机内码单字节,最高位是0
汉字字数太少,不支持繁体汉字,与ASCII码不兼容
GB18030汉字编码标准
汉字数目增加到27000多个,收录字符最多
支持繁体汉字
单字节编码表示ASCII字符
双字节编码表示汉字
中文标点符号“。”存储占用2个字节
四字节编码表示UCS/Unicode中的其他字符
GB 18030-2000 收录了27533个汉字
GB 18030-2005 收录了70244个汉字
向下兼容GB2312和GBK
与UCS/Unicode编码标准接轨
GB-18030实质上是UCS/Unicode字符集的另一种编码方案
GB-18030目前已在我国信息处理产品中强制贯彻执行
UCS/Unicode编码标准
Unicode称为“统一码”或“联合码”,能实现全球所有不同语言文字统一编码的国际编码标准
支持繁体汉字
不兼容我国的任何编码标准
分类
UTF-8
单字节编码
在Windows中文版操作系统中通常使用UTF-8来表示和处理文本
应用
Linux
Web
电子邮件
UTF-16
双字节编码
应用
Windows
Mac
Java
港澳台使用的汉字编码标准
CJK统一汉字编码
BIG5(大五码):只支持繁体字,与GB2312等大陆标准不兼容
西文字符的编码
基本的ASCII字符集共有128个字符,包括
96个可打印字符
32个控制字符
每个ASCII字符以1个字节存放(8位存储,最高位为0)
每个ASCII字符使用7个二进制位进行编码(表示)
不同的字符其编码各不相同
文本的编辑处理与文本的展现
字形码的应用
汉字由像素点组成,汉字输出可以是轮廓字,也可以是点阵字
汉字的字形码存放在汉字库文件中
文本展现
过程
先对文本的格式描述进行解释
然后生成文字和图表的印象
最后传送到显示器或打印机输出
展现方式
打印输出
屏幕显示
字库
两种不同的字库
点阵描述
例:16x16点阵的一个汉字字形需要32个字节(16x16/8=32)来存储
轮廓描述
Windows中采用的字形描述方法是轮廓描述
不同的字体对应不同的字库
在同一个字符集下,文本的输出所使用的字库不同
图像与图形及应用
色彩产生
光是一种电磁辐射,光的振幅和波长决定了光的颜色,波长决定了光的色相,振幅决定了光的明暗
色彩模型
RGB(三基色)模型
R代表红色,G代表绿色,B代表蓝色。RGB模型也称为加色模型,白色的R、G、B都为255,黑色的R、G、B都为0,红色的255.0.0,绿色的0.255.0,蓝色的0.0.255
面向硬件
HSB色彩模式
以色相(H)、饱和度(S)和亮度(B)描述颜色的基本特征
饱和度(指颜色的强度或纯度):0%为纯灰色,100%为完全饱和
亮度:指颜色的相对明暗程度
数字图像
数字图像按其生成方法
取样图像(也称点阵图像或位图图像)(简称图像)
如用数码相机拍摄的照片
如用扫描仪扫描的照片
如Windows画图程序绘制的图
取样图像在计算机中表示方法是灰度图用1个矩阵来表示,彩色图像用一组(3个)矩阵来表示
矢量图像(简称图形)
可以转换为取样图像,且矢量图形放大,缩小,旋转均不会失真,矢量图与分辨率无关
图形是由计算机绘制的图像,也称为矢量图形
矢量图占用的存储空间比取样图小
计算机图形能生成多个视图,而计算机图像只能生成一个视图
图像的主要参数
图像分辨率(用水平分辨率×垂直分辨率表示)
图像大小也叫图像分辨率
图像分辨率决定了像素数目
同像素深度和压缩编码情况下,分辨率越高,图像所占存储空间会越大
像素深度:像素深度决定了颜色数
位平面的数目:黑白图和灰度图只有1个位平面(亮度分量),彩色图像有3个或更多的位平面
黑白图用1位二进制表示
灰度图用8位二进制表示
颜色空间的类型
显示器使用的是RGB(红、绿、蓝)模型
图像编辑软件和用户界面使用的是HSB模型
彩色打印机使用的是CMYK(青、品红、黄、黑)模型
彩色电视信号传输时使用的是YUV(亮度、色度)模型
常用的图像获取设备
手机
扫描仪
数码相机
监控摄像头
图像的获取顺序(核心:模拟信号的数字化)
扫描
每个网格称为一个取样点,称为像素
分色
每种基色占1个位平面,非彩色图像(即灰度图像或黑白图)不必进行分色
取样
取样图像在计算机中用矩阵来表示,每个矩阵称为一个位平面,矩阵的行数称为垂直分辨率,矩阵的列数称为水平分辨率
量化:即把模拟量使用数字量来表示(图像数据量=分辨率×像素深度/8),对取样点每个分量的亮度进行A/D转换,使用数字整型量表示
数字图像处理的主要目的
提高图像的视感质量
图像复原与重建
图像分析
图像数据的交换、编码和数据压缩,使能更有效地进行图像的存储和传输
图像的存储、管理、检索以及图像内容与知识产权的保护
常用图像文件格式
JPEG(大多为有损):采用有损压缩算法,算法复杂度适中,在互联网和数码相机中被广泛使用,不支持透明背景,图像文件扩展名是.jpg,是一个静态图像数据压缩编码的国际标准,JPEG图像压缩比可以由用户控制,压缩比越高图像质量越差
GIF(无损):颜色数目不超过256色(像素深度8位),文件特别小,在网页制作中大量使用,文件扩展名是.gif,具有渐进显示功能,适合网络浏览器观看,能支持透明背景和动画,不适合真彩色图片(真彩色图像的像素深度为24位,可表示1600万种颜色)
TIF(无损):大多使用于扫描仪和桌面出版
PNG(无损):主要在互联网上使用,文件扩展名是.png
BMP(无损)
定义
是Windows操作系统下使用的一种标准图像格式,几乎所有Windows应用软件都支持,一个文件一幅图像,可以进行无损压缩,也可不压缩
属于静态图像文件格式,支持单色、16色、256色、真彩色图像
文件扩展名
.bmp
不适合在网页上大范围使用
JPEG 2000
采用小波分析等先进算法,压缩率更高,比JPEG好,更适合网上传输
常用图像处理软件
Word
PowerPoint
PhotoShop
Windows附件中的“画图”软件
数字图像的应用
卫星遥感
地图
气象
天文
交通
可视电话
医疗诊断
显微图像
超声成像
X光成像
DNA分析
CT
工业生产
生产监控
产品检测
CAD技术
通信应用
图像传输
影像传输
机器人视觉
计算机断层摄影(CT)
计算机图形(也称为计算机合成图像)
景物建模的两种方法
几何建模技术
过程建模技术
与景物类型有密切关系,比如树木,花草,烟火,毛发等去找出它们的生成规律,必须要相应算法来描述其形状规律
显卡的核心是绘图处理器(GPU,也叫图形处理器),显卡在绘制过程中起着关键作用
计算机图形的应用
计算机辅助设计和辅助制作(CAD/CAM)
设计绘制电路图(最直接的应用)
计算机动画和计算机艺术
利用计算机生成各种地形图
作战指挥和军事训练
电子出版
图像与图形的区别
图像的打开速度要比图形快
图像的数据量要比图形大
矢量绘图软件
微软公司的Microsoft Visio
Macromedia公司的FreeHand
Autodesk公司的AutoCAD
AutoCAD不是图像编辑软件
Adobe公司的Illustrator
Corel公司的CorelDraw
MS Office中内嵌的绘图软件
Word,Excel的绘图功能
PowerPoint中的绘图功能
计算机绘图的优点
数据量很小
数据量=(水平分辨率x垂直分辨率x像素深度/8)/压缩比
图形质量较高
图像的数据压缩
类型
无损压缩
用压缩后的数据还原出来的图像没有任何误差
例如哈夫曼编码
例如行程长度编码
声音中包含有大量冗余信息体现了无损压缩
有损压缩
用压缩后的数据还原出来的图像有一定的误差
人耳灵敏度有限,允许有一定失真而不易察觉体现了有损压缩
目的
节省存储空间
提高图像的传输速度,减少通信费用
可能性
数字图像中有大量的数据冗余
图像失真
评价压缩编码方法的优劣
重建图像的质量
压缩算法的复杂度
压缩倍数的大小
图形
定义
计算机合成制作的图像称为矢量图形,简称图形
波形声音的获取与播放
数字音频的表示与应用
定义
人耳可听见的声音在信息技术中称为音频信号,简称音频(模拟信号)
音频的频率范围:20HZ~20KHz
语音的取样频率为8KHz~16KHz,音乐的取样频率为40KHz以上
数字音频是一种使用二进制表示的按时间顺序组织的串行比特流
数字音频的主要参数
量化位数
通常为8位、12位或16位
声道数目
注:3.1声道为4声道,以此类推
取样频率
比特率:每秒钟的数据量,也称为码率
未经压缩的数字音频最常用的文件扩展名为“.wav”,压缩后的码率=未压缩时的码率/压缩比
计算机处理的音频
语音:专指人的说话声音,带宽仅为300~3400Hz
全频带声音:如音乐声、风雨声、汽车声等,其带宽可达到20Hz~20kHz
固定电话中使用PCM编码和ADPCM编码
数字音频编辑软件
主要功能
录音
编辑音频
效果处理
音频的格式转换
播放声音
谐波的频率范围称为声音的带宽
常见音频格式
.aac
.wma
.aiff
.amr
模拟声音信号的数字化
数字音频的获取设备
麦克风
将声波转换为电信号,然后由声卡进行数字化
声卡(以数字信号处理器(DSP)为核心)
物理组成
主处理芯片
包括数字信号处理器,MIDI控制,I/O控制等
CODEC芯片
负责多声道取样,A/D与D/A转换,混音处理等
功能
音频的获取与编码
音频的重建与播放
MIDI消息的输入
MIDI音乐的合成
声卡可以完成数字声音的编码和解码
数字声音是一种连续媒体,和视频一样数据量较大
例:Windows中的媒体播放器可以播放MIDI音乐,播放过程中必须借助于安装在声卡上的音乐合成器将其转换为波形信号
音乐合成器
组成
调频合成器
波表合成器
音频的获取设备
手机
数码录音笔
一般仅适用于录制语音
话筒
麦克风
音频信号数字化的过程
取样:取样的目的是把时间上连续的信号(模拟信号)转换成时间上离散的信号(数字信号),取样频率不应低于数字音频信号最高频率的两倍
量化:把每个样本从模拟量转换为数字量(8位和16位整数表示)量化精度越高,声音的保真度越好;反之亦然,采用A/D转换
编码:将所有样本的二进制代码组织在一起并进行数据压缩(声音码率=取样频率×量化位数×声道数Kb/s)
优点
有利于存储和传输
复制时不会产生失真
可以与其他媒体相互结合
数字音频及应用
计算机合成音频
全频带音频
为了保证对频谱很宽的全频道音乐信号采样时不失真,其取样频率应达到40kHz以上
频率范围
20Hz~20KHz
语音和全频带音频采用不同的压缩编码标准进行压缩
波形声音
注:语音是单声道,立体声是双声道
语音带宽更窄,取样频率也更低,立体声反之
音频信号数字化与音箱
音频信号
声音的重建与播放声音的重建是音频数字化的逆过程,分为三个步骤
解码
数模转换(D/A转换)
插值处理
声音的重建是把音频信号中数字形式转换成模拟信号形式,由声卡硬件来完成
音箱
普通音箱:接收的是重建的模拟音频信号
数字音箱:可直接接收数字音频信号,完成声音重建
声音重建
把音频信号从数字信号形式转换成模拟信号形式
数字音频的文件类型及应用
MP3:进行有损的压缩编码,缩短了网络传输的时间,按MPEG-1的层3标准进行编码
MP3是一种全频带声音压缩编码的国际标准
WMA:采用有损压缩方法,压缩比高于MP3
WAV:未压缩数字音频,音质与CD相当。WAV文件是波形声音文件
是由微软公司开发的一种音频流媒体
WAV格式声音可以与MP3声音进行相互转换
FALC、APE、M4A:采用无损压缩,数据量比WAV大约一半,音质保持相同
计算机合成音频类型
计算机合成语音:这个过程称为文语转换(简称TTS)
过程
文本分析
韵律处理
语音合成
应用
文稿校对
语言学习
语音秘书
自动报警
残疾人服务
计算机合成音乐(MIDI)
中文名称:乐器数字接口
三要素
乐器
由PC的声卡提供,声卡带有音源(也称为音乐合成器)
乐谱:使用MIDI音乐描述语言来表示,一首乐曲对应一个MIDI文件(MIDI文件也属于音频文件),其文件扩展名为.mid或.midi,MIDI传输的不是声音信号,而是音符及其控制参数等指令
“演奏员”
指计算机中的媒体播放器
应用
计算机作曲
特点
MIDI文件的数据量小
例:下列文件格式中相同时长的音频数据量最小的是mid A.wav B.wma C.mp3 D.mid
可表示的音乐不够丰富
同一首乐曲在计算机中既可以用MIDI来表示,也可以用WAV波形声音表示
MIDI文件只能合成音乐,不能合成歌曲
MIDI音乐不是一种全频带声音数字化音乐
常见的有损压缩音频
AAC
AC3
WMA
MP3
硬件播放器
MP3播放器
以播放音频为主,也能播放视频
MP4播放器
以播放视频为主,国外叫做PVP或PMP,LCD屏幕较大,价格较贵
平板、智能手机也有自带的视频播放器
数字视频及应用
视频信号的组成
电视画面是一种由于光点在显示屏上自左向右、自上而下不断高速扫描而形成的光栅图像,一般采用隔行扫描方式
特点
内容随时间而变化
视频具有与画面动作同步的伴随声音
视频信息的处理是多媒体技术的核心
数字视频的主要参数
帧频、帧速率
每秒钟显示多少帧图像,单位是fps
帧大小
每帧图像的分辨率,即图像宽度x图像高度(单位:像素)
颜色深度、像素深度
图像中每个像素的二进制数目(单位:bit)
图像扫描方式
逐行扫描
比隔行扫描更稳定,画面更自然
隔行扫描
常见的数字视频文件格式
.mp4
.avi
.flv
由Adobe公司开发的视频编码格式
.mov
.mpg
按照MPEG标准压缩的全运动视频图像文件格式
数字视频的获取设备
视频采集卡(简称视频卡)
例:数字摄像头必须通过视频卡与PC机相连接(✘)
视频卡一般插在PC机的PCI插槽内
数字摄像头
通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机
CCD芯片中像素越多,可拍摄的图像分辨率就越高(无前提条件)
接口
USB
FireWire
脱机获取设备
智能手机
数码相机
数码摄像机
数字视频的信息获取过程
滤波→取样→量化→编码
显示格式
标准清晰电视(SDTV,表示576i)
分辨率为720*576,隔行扫描
帧频为25fps,视频流的比特率为3Mb/s
DVD-Video光盘中的视频大多也是SDTV格式
高清晰电视(HDTV,表示1080i)
分辨率为1920*1080,隔行扫描(1080p是逐行扫描)
帧频为25fps,视频流的比特率约为8Mb/s
数字有线电视中高清频道播放的就是HDTV节目
超高清晰度电视(UHDTV,也称为4K电视)
分辨率为3840*2160,是HDTV的四倍以上
电脑显卡也支持4K显示,就连高端智能手机也能拍摄4K视频
8k(超高清晰度)
分辨率为7680*4320,每秒24p、30p和60p帧
8k的分辨率是4K的4倍,1080P的16倍
10K的分辨率为10240 *4320
分辨率为10240*4320,HDMI2.1标准支持
视频制式
NTSC制(即正交平衡调幅制):又称N制
优点:设备成本低
缺点:容易出现颜色失真、串色
扫描方式
隔行扫描
颜色模型
YIQ
美国,加拿大等西半球国家以及中国的台湾地区,日本,韩国,菲律宾都采用这种制式
PAL制
中国:25帧
美国:30帧
颜色模型
YUV
德国,英国等一些西欧国家以及中国,朝鲜等国家采用这种制式
SECAM制
兼容性不如NTSC制和PAL制
法国,苏联,东欧和中东等约65个国家采用这种制式
制定视频编码标准的组织
国际电信联盟通信标准部(ITU-T),制定的标准以H.26x的形式表示
国际标准化组织/国际电工技术委员会(ISO/IEC),制定的标准以MPEG-x的形式表示
制定视频编码标准的形式
H.261
主要应用:在低速通信网中进行可视电话/视频会议
H.263
主要应用:低码率的视频通信
MPEG-1
MPEG中文简称:动态图像专家组
主要应用:VCD、数码相机、数字摄像机和MP3等
MPEF-1编码层次
层1
编码简单
层2
算法复杂度适中
层3
编码复杂,编码效果最佳
MPEG-2/H.262
主要应用:DVD、卫星电视和数字有线电视等
MPEG-4
MPEG-4 ASP是低频压缩,主要应用于手机,监控,IPTV,MP4
MPEG-4 AVC(H.264)是高频压缩,主要应用于标清视频,蓝光光盘,HDTV,iPad,iPhone
H.264具有在高压缩比的同时还拥有高质量流畅的图像,能很好的在互联网环境和2G、3G和4G等移动通讯网上传输
编码标准与编/解码器(Codec)
同一种编码标准可以有许多不同的Codec产品
Codec可以是硬件(硬件编解码),也可以是软件(软件编解码)
数字视频的应用
可视电话和视频会议
可视电话
静态图像
动态图像
VCD、DVD和蓝光
数字电视、IPTV
数字电视机(简称DTV)接收机的三种形式
数字电视机
传统模式电视机+数字机顶盒
可以接收数字电视信号的PC机
视频点播(VOD)
目前,在互联网上支持视频直播或视频点播,一般采用的都是流媒体技术
使用户可以根据自己的喜好选择收看电视节目,从根本上改变用户被动收看电视的状况
基于C/S模式
视频监控
计算机动画
定义
使用计算机生成一系列内容连续的画面供实时演播的一种技术,它是一种计算机合成的数字视频,而不是用摄像机拍摄的自然视频,25帧/秒
分类
从空间角度
二维动画
三维动画
从动画的形成方式
帧动画
矢量动画
制作过程
描述景物的形状与结构(建模)
确定景物的颜色和材质(纹理)
设置灯光和确定虚拟摄像机的位置(确定位置)
描述场景中物体的运动和摄像机的移动(描述状态)
绘制一系列的图像
输出动画结果
动画制作的软件
加拿大Alias公司的Power animator
加拿大Vertigo公司的Vertigo
法国TDI公司的Explore
荷兰GIG公司的3DGO
美国Autodesk公司和Discreet公司的3dsmax,Animator Studio
互联网动画格式
GIF
Flash
流媒体技术
定义
允许在宽带网上让用户一边下载一边收看(听)音视频连续媒体的技术
代表
微软公司的wmv,ASF
形式
下载存储方式
下载完毕后播放
流式传输方式
边下载边播放
流媒体产品
微软公司的Microsoft Media Player
苹果公司的Quick Time Player
Real公司的RealPlayer
全能播放器
暴风影音
变色龙万能播放器
豪杰超级解霸
应用
视频会议
在线音频广播
实时音乐或视频点播
流媒体通常需要在客户端和服务器之间采用以下四种协议
实时传输协议RTP
实时传输控制协议RTCP
实时流协议RTSP
资源预留协议RSVP