导图社区 计算机系统结构
计算机系统结构
计算机系统结构基本概念
计算机系统结构
计算机系统层次结构
计算机系统结构定义
计算机组成与实现
计算机系统结构的分类
计算机系统设计技术
计算机系统设计的定量原理
计算机系统设计者的主要任务
系统结构的评价标准
性能
成本
计算机系统结构的发展
冯•诺依曼结构
软件对系统结构的影响
价格对系统结构的影响
应用对系统结构的影响
VlSI对系统结构的影响
技术的发展对价格的影响
算法和系统结构
指令系统
数据表示
数据表示与数据类型
浮点数据表示
自定义数据表示
寻址技术
编址方式
编址单位
寻址方式
指令格式的优化设计
指令的组成
操作码的优化表示
地址码的优化表示
指令格式设计举例
指令系统的功能设计
基本指令系统
复杂指令系统CISC
精简指令系统RISC
存储系统
存储系统原理
虚拟存储器
高速缓冲存储器
三级存储系统
输入输出系统
输入输出原理
中断系统
通道处理机
输入输出处理机
标量处理机
只有标量数据表示和标量指令系统的处理机称为标量处理机。 设计处理机的基本任务是要缩短指令解释的时间。 指令解释时间缩短途径:1提高处理机的工作主频,2采用更好的算法和设计更好的功能部件,3多条指令并行执行,称为指令级并行技术。
先行控制技术
先行控制技术的关键是缓冲技术和预处理技术,以及这两种技术的结合。
指令的重叠执行方式
按照一条指令执行过程分三个阶段
顺序执行
一次重叠
一次重叠: 如一条指令分取指,分析,执行三个阶段,第k条指令的执行阶段和第k+1条指令的取指阶段同时发生。
二次重叠
二次重叠:取k+1条指令与分析k条指令同时进行,分析k+1条指令与执行k条指令同时进行。
先行控制方式的原理和结构
原理
先行控制技术的关健是缓冲技术和预处理技术,缓冲技术的关键是在两个处理速度不固定的功能部件之间设置缓冲栈,用以平滑他们的工作。在采用先行控制方式的处理机中,一般要设置四个缓冲栈。预处理技术是把进入运算器的指令都处理成寄存器—寄存器(RR型)型指令,他与缓冲技术相结合,为进入运算器的指令准备好所有所需操作数。
流水线处理机
超标量与超流水线处理机
向量处理机
向量处理机目前是解决数值计算的一种重要的高性能计算机结构。两个优点:效率高和适用性广。 在数学中,向量(也称为欧几里得向量、几何向量、矢量),指具有大小(magnitude)和方向的量。它可以形象化地表示为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。与向量对应的量叫做数量(物理学中称标量),数量(或标量)只有大小,没有方向。 向量:几何中一般用坐标值来表示点,坐标一般为数组元素。凡是符合向量定义的各种向量表示的计算操作,一般均用向量处理机来处理。如数组和矩阵的向量计算。
向量处理机的基本概念
什么是向量处理
标量指令序列
栗子:数组标量处理方式的指令(每次只能处理两个操作数)
向量处理
栗子:数组中每个元素均为向量元素,对A和B两个数组计算,向量处理每次可以处理N对或者N个元素
向量处理的方式
大型数组的计算一般包含向量计算。按照数组中各计算相继的次序,可以把向量处理的方式分为三种:横向处理方式,纵向处理方式,纵横处理方式。
横向处理
一般适用于标量计算机(循环计算)
纵向处理
适用于向量处理机
纵横处理
长度为n的向量分若干组,组内纵向处理
向量处理机的结构
向量处理机的基本思想是把两个向量的对应分量进行运算,产生一个结果向量。
向量处理机设计者面临的问题
系统结构设计者面临的问题是设计出一个能满足处理器带宽要求的存储系统
存储器—存储器结构
寄存器—寄存器结构
向量处理机的存取模式和数据结构
数值算法的存取模式
计算机系统结构必须有负载相适应,这样才能获得高性能。就是说高性能系统结构做高性能要求的事。
稠密矩阵
高斯消去法
向量处理机的数据结构
提高向量处理机性能的方法
向量处理机系统结构的设计目标
较好的维持向量/标量性能平衡
可扩展性随处理机数目的增加而提高
可扩展性的简单定义:随处理机的数目增加,系统的性能应线性提高。
规模可扩展性
换代可扩展性
问题可扩展性
增加存储器系统的容量和性能
提供高性能的IO和易访问的网络
提高向量处理机性能的常用技术
链接技术
向量指令可分为四类
第一类向量指令
从一个或二个向量寄存器取得数据,并将结果返回到另一个向量寄存器
第二类指令
从Sj寄存器取得一个标量操作数,又从Vk寄存器取得一个向量操作数,并将结果返回给另一个向量寄存器Vi
第三类指令
把数据从存储器传送到向量寄存器中
第四类指令
把数据从向量寄存器传送到存储器中
向量循环或分段开采技术
当向量的长度大于向量寄存器的数目时,必须把长向量分成长度固定的段。处理长向量的程序结构称为向量循环。这种技术也称为分段开采,一次处理一个向量段。
向量递归技术
结果操作数与源操作数使用同一个向量寄存器,结果递归操作传输至源操作数所在的向量寄存器。
稀疏矩阵的处理技术
我们把许多元素值为零的矩阵称为稀疏矩阵
向量处理机实例
向量处理机的历史与现状
向量协处理器
科学计算要求计算机系统能高速的处理大量数据,向量处理机较好的解决了这一问题,如CDC STAR,Cray1向量处理机。但是这些机器都是巨型的,规模大,价格高,适用于解决大工程和大系统的问题。一般科学计算的用户不可能,也不必去买一台价格昂贵的巨型机,因而只能在中小型计算机上用标量的处理方式处理向量问题。但是,这样的话,效率低,不能满足用户需求,因此产生了向量协处理器。用来处理向量问题的处理器,作为中小型计算机的外围设备,与之结合起来,价格能接受,处理向量问题效率提高。
向量处理机的性能评价
向量指令的处理时间Tvp
一组向量操作的执行时间取决于
向量长度
向量操作之之间是否存在流水部件的冲突和数据的相关性
把几条能在一个时钟周期内执行的向量指令称为一个编队
最大性能R∞
R∞表示向量长度无穷大时候,向量流水线处理的最大性能。常在评价峰值性能时使用,单位MFLOAPS。
半性能向量长度n1/2
达到一半R∞值所需的向量长度
关于向量处理机的几点看法
向量计算机系统结构发展趋势
提供向量指令
除具有向量处理功能外还具有其他功能
采用多层次的存储器系统
流水线技术与并行技术相结合
向量计算机系统结构如何解决这几个问题
处理器带宽
运算器采用流水线结构,多个运算器组成并行系统
存储器带宽
彼此独立的存储体构成存储器系统,随着存储体数目增加,存储器带宽增加。采用多级存储,高速缓冲存储器和可寻址的寄存器组。
输入输出系统带宽
一般存储器带宽增加,输入输出系统带宽也增加了。
通信带宽
一种情况下,通信带宽与存储器带宽同一个值。现讨论的向量处理机系统不涉及处理器之间的通信。
同步
对于单条流水线来说,运算是按进入流水线的顺序,所以同步是自动进行的。
多用途
互联网络
互联网络的基本概念
消息传递机制
互联网络实例
SIMD计算机
SIMD计算机有时也称并行处理机。因为它是单一控制部件控制下的多个处理单元构成的阵列,所以有时也称阵列处理机。SIMD计算机主要使用于要求大量高速向量或矩阵运算的场合。SIMD全称Single Instruction Multiple Data,单指令多数据流,能够复制多个操作数。
SIMD计算机模型
SIMD计算机的基本结构
SIMD计算机实例
SIMD计算机的应用
连续模型的结构向何处发展
多处理机
多处理机结构
多处理机性能模型
多处理机的cache一致性
多处理机实例
多处理机算法
简单并行性
同步技术
并行搜索
串行算法到并行算法的转换
同步并行算法和异步并行算法
并行程序设计语言及其实现方法
结论
计算机系统结构的新发展
数据流计算机
数据库机与知识库机
面向函数程序设计语言的归约机
实验:DLX处理器
DLX基本结构
DLX流水线结构
实验环境与内容