导图社区计算机组成原理

计算机组成原理

对于正在备战计算机考研的学子以及计算机相关专业的学生来说，这张计算机组成原理的思维导图模板堪称学习利器，是助力他们深入掌握专业知识的宝藏资料。计算机组成原理作为计算机科学与技术专业的核心课程，涵盖了计算机系统从底层硬件到逻辑功能等多个层面的知识。这张思维导图以“计算机组成原理”为中心，全面且细致地辐射出各个关键知识板块。在中央处理器部分，详细梳理了控制器的功能与工作原理、指令流水线等重要概念，帮助学生理解计算机的指挥中枢如何运作。数据表示与运算板块则聚焦于运算方法和运算器、数据表示等内容，是掌握计算机数据处理基础的关键。存储系统部分，从存储器分类到主存储器与CPU的连接，再到高速缓冲存储器等，深入剖析了计算机的存储架构，让学生明白数据在计算机中的存储与读取机制。输入输出系统介绍了总线、I/O系统等知识，揭示了计算机与外部设备之间数据传输的奥秘。指令系统板块则详细讲解了指令格式、寻址方式等内容，是理解计算机如何执行指令的重要基础。这张思维导图采用清晰的层级结构和逻辑脉络，将计算机组成原理中复杂的知识点有机串联起来，使学习者能够一目了然地把握知识体系的全貌。

编辑于2026-03-19 14:34:13

计算机组成原理
计算机考研
王道408

EDmFGpiG

他的近期作品查看更多>>

计算机组成原理

社区模板帮助中心，点此进入>>

EDmFGpiG

他的近期作品查看更多>>

相似推荐
大纲

开学典礼：时间规划
- 4.6k
- 157
- 80
- 11
- 0
Jason
大学生职业规划思维导图
- 6.1k
- 50
- 39
- 11
- 0
吃太阳的猫????
大学生职业发展规划
- 4.5k
- 158
- 61
- 8
- 0
远走高飞
大学生职业规划知识总结
- 4.4k
- 9
- 60
- 9
- 0
雪茉
大学生毕业去向
- 3.6k
- 14
- 42
- 6
- 0
美少女
大学生行为礼仪规范
- 2.9k
- 53
- 50
- 10
- 0
呱小呱
全国大学一览图
- 3.4k
- 14
- 146
- 23
- 0
17316931273
大一新生入学必备物品清单
- 3.0k
- 7
- 68
- 14
- 0
北冥有鱼
蓓蕾入学
- 1.4k
- 3
- 0
- 0
- 0
金兰＇s
大学生创业基础
- 7.1k
- 112
- 100
- 20
- 0
罙

计算机组成原理

计算机系统概论

计算机发展历程

计算机系统层次结构

计算机系统的组成

软件系统

硬件系统

计算机硬件

冯·诺依曼机的基本思想

冯诺依曼结构的模型机

基本工作方式

数据流驱动方式

按照指令的执行顺序，依次读取指令，然后根据指令所含的控制信息，调用数据信息进行处理

执行程序的过程中，始终以控制信息流为驱动工作的因素，数据信息流是被动的调用处理

特点

按地址访问并顺序执行指令

数据采用二进制编码表示主要原因是

二进制的运算规则简单

制造两个稳态的物理器件较容易

便于用逻辑门电路实现算数运算

计算机的功能部件

输入设备

输出设备

存储器

主存储器

按地址存取方式

组成

存储体

有许多存储单元组成

每个存储单元包含若干存储元件

存储字

存储字长

1B(8bit)或字节的偶数倍

每个存储元件存储一位二进制代码“0”或“1”

存储器地址寄存器（MAR）

MAR的长度与PC的长度相等

存储器数据寄存器（MDR）

位数通常等于存储字长

时序控制逻辑

辅助存储器

运算器

算数运算、逻辑运算

算术逻辑单元（ALU）

累加器（ACC）

乘商寄存器（MQ）

操作数寄存器（X）

变址寄存器（IX）

基址寄存器（BR）

···

程序状态寄存器（PSW）

控制器

程序计数器（PC）

指令寄存器（IR）

控制单元（CU）

计算机软件

系统软件和应用软件

三个级别的语言

机器语言

是计算机唯一可以直接识别和执行的语言

汇编语言

用助记符编写

特定的汇编语言与特定的机器语言指令是一一对应的，不同平台之间不可直接转移

高级语言

翻译程序

汇编程序（汇编器）

将汇编语言翻译成机器语言

解释程序（解释器）

将源程序中的语句按执行顺序逐条翻译成机器指令并立即执行

如 JavaScript、Python等，一般速度较编译程序慢

编译程序（编译器）

将高级语言程序翻译成汇编语言或机器语言程序

相同的高级语言程序在不同计算机上编译生成的机器指令条数可能不同

编译：是把高级语言源程序经词法、语法、语义分析及代码生成优化转化为汇编语言程序汇编：将汇编语言源程序翻译为机器语言目标文件，处理符号地址链接：则把多个目标文件与库文件链接成可执行文件，完成符号解析、重定位及库链接

软件和硬件的逻辑功能等价性

计算机系统的层次结构

多层次结构

微程序机器层

传统机器语言层

操作系统层

汇编语言层

高级语言层

虚拟机器

指令集体系结构（ISA）

计算机系统的工作原理

“存储程序”工作方式

从源程序到可执行文件

UNIX系统中的GCC编译器程序

预处理阶段

编译阶段

汇编阶段

链接阶段

指令执行过程的描述

取指令

PC->MAR->M->MDR->IR

分析指令

OP(IR)->CU

执行指令

Ad(IR)->MAR->M->MDR->ACC

补充

系列机的基本特征是指令系统向后兼容

相联存储器（CAM）

既可以按地址寻址又可以按内容寻址

IR、MAR、MDR是CPU内部工作寄存器，对用户是完全透明的

计算机的性能指标

计算机的主要性能指标

机器字长

一个存储单元中的位数

等于MDR的位数（通用寄存器位数）、ALU位数

说明

指令字长取决于指令的功能和格式，可以是单字长、半字长或双字长

指令寄存器位数不一定等于机器字长

计算机的位数是指机器字长，也是计算机一次能处理的二进制数的长度

操作系统的位数是指操作系统可寻址的位数

机器字长越长，数据的位数越多，定点数或浮点数所表示及运算的精度就越高

机器字长与运算速度关系不大，与存取速度和内存容量没有关系

数据通路带宽

主存容量

运算速度

吞吐量

系统在单位时间内处理的请求数量

是评价计算机系统性能的综合参数

响应时间

包括CPU时间与等待时间、存储器访问、I/O操作、操作系统开销等

时钟周期

时钟信号的宽度

时钟信号由机器脉冲源发出的脉冲信号经整形和分频后形成

时钟周期以相邻状态单元间组合逻辑电路的最大延迟为基准确定

主频

时钟周期的倒数

CPI

执行一条指令所需的时钟周期数

平均CPI

IPS

每秒执行多少条指令

IPS = 主频 / 平均CPI

IPC

每个时钟周期运行多少条指令

CPU执行时间

运行一个程序花费的时间

CPU执行时间 = CPU时钟周期数÷主频 = (指令条数×CPI)÷主频

MIPS

每秒执行多少百万条指令

MIPS = 指令条数÷(执行时间×106) = 主频÷(CPI×106)

FLOPS

每秒执行多少次浮点运算

MFLOPS

GFLOPS

TFLOPS

PFLOPS

EFLOPS

ZFLOPS

基准程序

几个专业术语

系列机

具有基本相同的体系结构，使用相同基本指令系统的多个不同型号的计算机组成的一个产品系列

兼容

软件或硬件的通用性

固件

将程序固化在ROM中组成的部件

数据表示与运算

数制与编码

进位计数制及其相互转换

进位计数制

二进制（B）

八进制（O）

十六进制（H 或 0x）

十进制（D）

不同进制数之间的相互转换

二进制数转换位八进制数和十六进制数

整数部分高位补“0”，小数部分低位补“0”

任意进制数转换为十进制数

十进制数转换为任意进制数

基数乘除法

整数部分

除基取余法

小数部分

乘基取整法

定点数的编码表示

真值和机器数

机器数的定点表示

定点整数

定点小数

原码、补码、反码、移码

原码表示法

用机器数的最高位表示数的符号

缺点

0 的表示不唯一，有±0 两个编码

加减运算比较复杂

补码表示法

正数的补码与原码相同

负数的补码等于模与该负数绝对值之差

n+1位补码的模为2n+1

补码与真值之间的转换

真值转换为补码

正数

负数

符号位取1，其余各位由数值部分“按位取反，末位加1”得到

补码转换为真值

符号位为0

与原码方式一样

符号位为1

真值符号位负，数值部分由补码数值部分“按位取反，末位加1”得到

变形补码（模4补码）

便于判断运算结果是否溢出

00表示正，11表示负

反码表示法

正数的反码表示与原码表示相同

移码表示法

在真值 x 上加上一个常数（偏移值，通常为2n）

特点

零的表示唯一

补码的符号位取反得到移码，反之亦然

全零对应真值最小值，全1对应真值最大值

移码保持了数据原有的大小顺序

整数的表示

无符号数的表示

范围 0 ~ 2n-1

有符号数的表示

计算机中的有符号整数都用补码表示

范围 -2n-1~ 2n-1-1

C语言中的整数类型及类型转换

C语言中的整型数据类型

短整型（16位）

整型（32位）

长整型

在32位机器中为32位，在64位机器中位64位

无符号（unsigned）

字符型（char，8位）

强制类型转换

TYPE b = (TYPE) a

保持二进制各位的值不变，仅改变解释这些位的方式

C语言存在隐式类型转换

有符号数与无符号数的转换

无符号数和有符号数一起参与运算时，计算机按无符号数来解释最终的执行结果

不同字长整数之间的转换

小字长转为大字长

原数字是无符号整数

零扩展

有符号整数

符号扩展

大字长转为小字长

直接截取低位部分

运算方法和运算电路

基本运算部件

一位全加器

全加器（FA）

加数Ai、加数Bi和低位传来的进位Ci-1

和表达式

Si = AiÅBiÅCi-1

进位表达式

串行进位加法器

将n个全加器相连可得到n位加法器

行波进位

位数越多，延迟时间越长

并行进位加法器

带标志加法器

溢出标志 OF

OF = CnÅCn-1

符号标志 SF

SF = Fn-1

零标志 ZF

ZF=1 当且仅当 F=0

进位/借位标志 CF

CF = CoutÅCin

算数逻辑单元（ALU）

Cin

ALUop

控制多路选择器（MUX）

定点数的移位运算

逻辑移位

算术移位

定点数的加减运算

补码的加减运算

溢出的判别方法

仅当两个符号相同的数相加或两个符号相异的数相减时才可能产生溢出

判别方法

采用一位符号位

采用双符号位

符号位00表示正数，11表示负数

计算结果符号位 Ss1Ss2

结果为正，无溢出

结果正溢出

结果负溢出

结果为负，无溢出

存储模4补码仅需一个符号位，只在ALU中采用双符号位

采用一位符号位根据数值位的进位情况判断溢出

V = CnÅCn-1

正溢出

两正相加，最高有效位产生进位，符号位不产生进位

负溢出

两负相加，最高有效位不产生进位，符号位产生进位

加减运算电路

原码的加减法运算

定点数的乘除运算

定点乘法运算

乘法运算的基本原理

用加法和移位运算实现

乘法运算电路

除法运算

基本原理

除法运算电路

补充

算数左移前后符号位不一致，说明发生了溢出

浮点数的表示与运算

浮点数的表示

浮点数的表示格式

N = (-1)s×M×RE

32位浮点数

符号 S

阶码 E

反映表示范围

尾数 M

反映精度

基数 R

浮点数的进制，决定了阶码变化的权重

浮点数的表示范围（非IEEE 754标准规格化浮点数）

负数

负上溢，负下溢

正数

正下溢，正上溢

浮点数运算下溢，直接当做机器零处理，不会引发中断；浮点数上溢引发内中断

浮点数的规格化

左规

尾数最高位不是有效位

尾数每左移一位，阶码减1

右规

运算结果的有效位进到小数点前面

尾数右移一位，阶码加1（右规只需一次）

基数为2的原码规格化位数M应满足 1/2≤|M|<1

正数为 0.1×...×的形式

最大

0.11...1

1-2-n

最小

0.100...0

1/2

负数为1.1×...×的形式

最大

1.100...0

-1/2

最小

1.11...1

-(1-2-n)

当尾数为补码表示，负数的格式化形式为 1.0x...x

规格化的目的是为了增加数据的表示精度

IEEE 754 标准

格式

符号+阶码+尾数

单精度

1+8+23

阶码取值范围1~254

全0和全1的阶码用来表示特殊值

双精度

1+11+52

阶码用移码表示，尾数用原码表示

默认规格化存储，尾数的最高位（整数位）总是1，为隐藏位

真值

单精度

(-1)×1.f×2e-127

双精度

(-1)×1.f×2e-1023

特殊值

+0/-0

全0阶码全0尾数

+¥/-¥

全1阶码全0尾数

非数（NaN）

全1阶码非0尾数

非规格化数

全0阶码非0尾数

(-1)×0.f×21-127

定点、浮点表示的区别

数值表示范围

精度

相同字长，浮点数扩大了表示范围，精度降低

数的运算

溢出问题

浮点运算规格化后阶码超出所能表示范围才发生溢出

浮点数的加减运算

对阶

求阶码差

小阶码向大阶码看齐

阶码小的尾数每右移移位，阶码加1

尾数加减

尾数规格化

舍入

舍入方法

就近舍入

正向舍入

负向舍入

截断法

说明

定点数没有舍入的概念

浮点数舍入的情况有两种

对阶

右规格化

舍入不一定产生误差

C语言默认舍入规则

要舍弃的部分最高位为0

直接截断

最高位为1剩余部分不为0

进位

最高位为1剩余部分为0，看保留部分最低位

最低位为0，直接截断，否则进位

溢出判断

指数上/下溢

右规和尾数舍入

左规

C语言中的浮点数类型

float和double

类型提升和隐式类型转换

int型和float型的精度和范围分析

数据的大小端和对齐存储

数据的“大端方式”和“小端方式”存储

最低有效字节（LSB）和最高有效字节（MSB）

大端方式

先存储高位字节

字中的字节顺序和原序列相同

小端方式

先存储低位字节

字中的字节顺序和原序列相反

数据按“边界对齐”方式存储

为提高内存访问效率和满足硬件要求，将不同数据类型按其自身大小倍数的特定边界进行存储，结构体等复合类型也遵循相关对齐规则以保证整体存储地址符合要求的策略

存储系统

存储器概述

存储器的分类

按在计算机中的作用（层次）分类

主存储器

辅助存储器

高速缓冲存储器

按存储介质分类

磁表面存储器

磁带、磁盘

磁芯存储器

半导体存储器

MOS型存储器、双极型存储器

光存储器

光盘

按存取方式分类

随机存储器（RAM）

只读存储器（ROM）

串行访问存储器

顺序存取存储器（SAM）

磁带

直接存取存储器（DAM）

速度介于随机存储器和顺序存储器之间

磁盘、光盘

按信息的可保存性分类

易失性存储器

非易失性存储器

读出类型

破坏性读出

非破坏性读出

存储器的性能指标

存储容量

存储字数×字长

单位成本

总成本÷容量

存储速度

数据传输速率（每秒传送的信息位数） = 数据宽÷存取周期

存取时间Ta

分读出时间和写入时间

存取周期Tm

存储器进行一次完整的读/写操作所需的全部时间

主存带宽Bm

数据传输速率

每秒从主存进出信息的最大数量

单位：字/秒、B/s、b/s

多级层次的存储系统

主要思想

上一层的存储器作为低一层存储器的高速缓存

主存和Cache之间的数据调动是由硬件自动完成的，对程序员透明

主存和辅存之间的数据调动是有硬件和操作系统共同完成的，对应用级程序员以上透明

主存储器

SRAM芯片和DRAM芯片

存储元、存储单元、存储体

SRAM

静态随机存储器

工作原理

存储元用双稳态触发器（六晶体管）来记忆信息

即使信息被读出后，仍保持原状态（非破坏性读出）

存取速度快，但集成度低，功耗较大，价格昂贵

一般用作高速缓存

DRAM

动态随机存储器

工作原理

利用存储元电路中栅极电容上的电荷来存储信息的

基本存储元只使用一个晶体管

相对SRAM

集成度高，位价低，功耗小

存取速度慢

一般用于大容量的主存系统

刷新

原因

电荷一般只能维持1~2ms

读操作会使其状态发生改变（破坏性读）

刷新周期

对同一行进行相邻两次刷新的时间间隔，通常2ms

刷新方式

集中刷新

死时间（访存死区）

分散刷新

存储器系统的工作周期分为两部分，前半用于正常读写，后半用于刷新

没有死区，但加长了系统的存取周期

异步刷新

刷新周期÷行数=相邻两行之间刷新的间隔 t

每隔时间 t 发出一次刷新请求

死时间分布更加分散，避免CPU连续等待过长时间

注意

刷新对CPU透明

DRAM刷新单位是行，芯片内部自行生成行地址

刷新操作类似于读操作

地址引脚复用技术

行地址和列地址通过相同的引脚分前后两次输入

当地址线增加一根时，通过地址线服用技术，容量至少提高到原来的4倍

行(r)、列(c)数的优化原则

减少地址引脚数

使|r-c|最小

减少刷新开销

r≤c

行缓冲容量的计算

行缓冲器

大小 = 列数×存储元的位数

采用SRAM

DRAM芯片的容量

位平面数×行数×列数

SDRAM（同步DRAM）芯片

SRAM和DRAM的比较

都是易失性半导体，区别在于是否需要刷新

存储器芯片的内部结构

存储体

存储单元的集合

行选择线 X 和列选择线 Y 选择所访问的单元

地址译码器

单译码器

双译码器

I/O电路

片选控制线

读/写控制器

只读存储器

ROM的特点

结构简单，位密度高

具有非易失性，可靠性高

类型

掩模式只读存储器（MROM）

一次可编程只读存储器（PROM）

一旦写入，内容就无法改变

可擦除可编程只读存储器（EPROM）

编程次数有限，写入时间过长

Flash存储器

不加电可长期保存，在线可进行快速擦除与重写

写入前需要擦除原有数据，比读取要慢

U盘采用Flash存储器技术，属于ROM

固态硬盘（SSD）

由控制单元和存储单元（Flash）组成

主存储器（MM）的基本组成

译码驱动电路

存储矩阵

读写电路

地址线、数据线、片选线、读写控制线

多模块存储器

空间并行技术

提高存储器的吞吐率

单体多字存储器

每次并行读出m个连续的字

总线宽度要扩展为m个字

缺点

只有指令和数据在主存中连续存放时才能有效提升存取速度

多体并行存储器

高位交叉编址

高位地址表示模块号，低位地址为模块内地址

仍是顺序存储器

低位交叉编址

模块号 = 单元地址 % m

轮流启动方式

存储器交叉模块数 m ≥ 模块存取周期T / 总线周期r

连续存取m个字所需时间

t = T+(m-1)r

访存冲突

m次访问的访存地址出现在同一个模块内

此时需延迟发生冲突的请求

同时启动方式

所有模块一次并行读/写的总位数正好等于数据总线的位数

主存储器与CPU的连接

连接原理

数据总线

地址总线

控制总线

主存容量的扩展

位扩展法

CPU的系统数据线数多于存储芯片的数据位数

字扩展法

系统数据线位数等于芯片数据线位数，系统地址线位数多于芯片地址线位数

由系统地址线的高位译码得到个芯片的片选信号

字位同时扩展法

二者组合组合

存储芯片的地址分配和片选

线选法

译码片选法

存储器与CPU的连接

合理选择存储芯片

地址线的连接

实际的主存容量不能代表MAR的位数，MAR应保证能访问到整个主存地址空间

数据线的连接

读/写控制线的连接

低电平有效

片选控制线的连接

外部存储器

磁盘存储器

优缺点

优点

存储容量大，位价低

记录介质可重复使用

记录信息可长期保存不丢失

非破坏性读出

缺点

存取速度慢

机械结构复杂

对工作环境要求全较高

磁盘存储器

磁盘存储器的组成

组成

磁盘驱动器

由磁头、磁盘和读写电路等组成，不是I/O接口

磁盘控制器

磁盘盘片

存储区域

记录面->磁道->扇区(块，磁盘读/写的最小单位)

磁头数

柱面数

扇区数

磁盘高速缓存

磁记录原理

原理

编码方法

磁记录方式

磁盘的性能指标

记录密度

道密度

沿磁盘半径方向单位长度上的磁道数

位密度

磁道单位长度上的二进制代码位数

面密度

位密度×道密度

磁盘的容量

非格式化容量

记录面数×柱面数×每条磁道的磁化单元数

格式化容量

记录面数×柱面数×每道扇区数×每个扇区的容量

格式化要对磁盘划分扇区，写入一些控制信息，扇区尾部还要留一定空隙，导致格式化后的实际容量要比非格式化的容量要小

存取时间

寻道时间+旋转延迟时间+传输时间

旋转延迟时间平均期望为旋转半圈的时间

数据传输速率

单位时间向主机传送数据的字节数

Dr = rN

磁盘转速为 r 转/秒，每条磁道容量为 N 字节

磁盘地址

驱动机号 | 柱面(磁道)号 | 盘面(磁头)号 | 扇区号

磁盘的工作过程

寻址、读盘、写盘

读/写是串行的

成批（组）方式进行数据读/写

磁盘阵列

RAID（独立冗余磁盘阵列）

思想

多个独立的物理磁盘组成一个独立的逻辑盘

数据在多个物理盘上分割交叉存储，并行访问

提高存储性能、可靠性、安全性

RAID0

无冗余无校验

条带化

提高读/写速率

RAID1

镜像磁盘互为备份

容量减少一半

RAID2~5

通过数据校验提高容错能力

固态硬盘

原理

基于闪存技术的存储器

电可擦除ROM（EEPROM）

组成

闪存翻译层

负责翻译逻辑块号，找到对应页（Page）

存储介质

多个闪存芯片（Flash Chip）

每个芯片包含多个块，每个块包含多个页

读写性能特性

以页（Page）为单位读/写

相当于磁盘的“扇区”

以块（Block）为单位“擦除”，擦干净的块，其中的每页都可以写一次，读无限次

支持随机访问，系统给定一个逻辑地址，闪存翻译存可通过电路迅速定位到对应的物理地址

读快、写慢

要写的页如果有数据，则不能写入，需要将块内的其他页复制到一个新的（擦除过的）块中，再写入新的页

与机械硬盘相比的特点

SSD读写速度快，随机访问性能高，用电路控制访问位置；机械硬盘通过移动磁臂旋转磁盘控制访问位置，有寻道时间和旋转延迟

SSD安静无噪声、耐摔抗震、能耗低、造价更贵

SSD的一个“块”被擦除次数过多（重复写同一个块）可能会坏掉机械硬盘的扇区不会因为写的次数太多而坏掉

磨损均匀技术

思想

将“擦除”平均分布在各个块上，以提升使用寿命

动态磨损均匀

写入数据时，优先选择累积擦除次数少的心闪存块

静态磨损均匀

SSD检测并自动进行数据分配、迁移，让老旧的闪存块承担以读为主的存储任务，让较新的闪存块承担更多写任务

高速缓冲存储器

程序访问的局部性原理

时间局部性

空间局部性

Cache的基本工作原理

将某些主存块复制到Cache中，缓和CPU与主存之间的速度矛盾

两种访问方式

先访问Cache，未命中再访问主存

同时访问，若Cache命中则停止访问主存

主存地址可拆分为 [主存块号, 块内地址] 的形式

Cache的功能完全由硬件实现

CPU访存时发送的时主存物理地址

性能分析

命中率

H = Nc/(Nc+Nm)

平均访问时间

Ta = Htc+(1-H)tm

Cache总容量 = 存储容量 + 标记阵列容量（有效位、标记位等）

页式内存管理的页面失效率

= 未命中次数 / 总访问次数

Cache和主存的映射方式

直接映射

Cache行号 = 主存块号 mod Cache总行数

冲突，原来的块将无条件的被替换出去

地址结构

标记 | Cache行号 | 块内地址

全相联映射

主存中的块可以装入Cache中的任何位置

组相连映射

将Cache分成Q个大小相等的组

Cache组号 = 主存块号 mod Cache组数

地址结构

标记 | 组号 | 块内地址

标记项

有效位 | 脏位 | 替换控制位 | 标记位

r路组相连映射需设置r个比较器

Cache中主存块的替换算法

随机算法（RAND）

先进先出（FIFO）

近期最少使用（LRU）

对每个Cache行设置一个计数器（LRU替换位）

计数变化规则

命中时，所命中行计数器清零，比其低的计数器加1，其余不变

未命中且还有空闲行时，新装入的行的计数器置0，其余非空闲行全加1

未命中且无空闲行时，计数最多的替换，新装入的置0，其余加1

最不经常使用（LFU）

新行装入置0，每被访问一次就加1，替换访问次数最少的行

Cache的一致性问题

写命中

全写法（直写法）

写命中后，把数据同时写入Cache和主存

写缓冲

FIFO队列，减少时间损耗

回写法

替换出时才写回主存

修改位（脏位）

写不命中

写分配法

更新主存单元，然后将主存块调入Cache

非写分配法

只更新主存单元

多级Cache

各级Cache间

全写法+非写分配法

Cache和主存间

写回法+写分配法

分离Cache结构

指令Cache

数据Cache

虚拟存储器

虚拟存储器的基本概念

虚地址（逻辑地址）

虚拟页号+页内字地址

逻辑地址的位数比物理地址多

采用全相连映射+写回法

页式虚拟存储器

主存空间和虚拟地址空间都被划分成相同大小的页

物理页（实页、叶框）

主存中的页

虚拟页（虚页）

分页对程序员透明

页表

有效位

脏位

引用位

缺页

属于内部异常

缺页处理完成后回到产生缺页终端的那一条指令开始重新执行

地址转换

虚拟地址

高位为虚页号

低位为页内偏移地址

物理地址

高位为物理页号

低位为页内偏移地址

转换

页表基址寄存器

存放进程的页表首地址

根据虚拟页号找到对应的页表项

装入位为1，取出物理页号

物理页号和虚拟地址的页内地址拼接得到实际物理地址

快表（TLB）

使用SRAM实现

全相连或组相连映射

TLB表项

页表表项内容

TLB标记

全相连下对应虚拟页号

组相连，对应虚拟页号的高位部分，低位作为组号

具有TLB和Cache的多级存储系统

CPU访存过程中的三种缺失情况

TLB缺失

即可以用硬件，又可以用软件来处理

Cache缺失

Page缺失

此时TLB、Cache均缺失

段式虚拟存储器

段是按程序的逻辑结构划分的，各个段的长度因程序而异

分段对程序员不透明

虚拟地址

段号

段内地址

优缺点

优点

具有逻辑独立性

缺点

分配空间不便，容易在段间留下碎片

段页式虚拟存储器

程序按逻辑结构分段，每段再划分固定大小的页

主存空间分页，程序对接主存的调入、调出以页为基本交换单位

虚地址

段号

段内页号

页内地址

虚拟存储器与Cache的比较

不同

Cache主要解决系统速度，虚拟存储器解决主存容量

虚拟存储器由OS和硬件共同实现，对应用程序员透明，系统程序员不透明

虚拟存储器不命中对性能影响更大

补充

Cache-主存-外存交换

Cache与主存之间交换

交换的是主存块

使用硬件实现

主存与外存之间的交换

交换的是页

使用软件实现

使用回写法

使用全相连映射

Cache的中位数应包括标记项的总位数（包括标记字段、有效位和“脏”位）和数据块的位数

指令系统

指令集体系结构

ISA完整定义了软件和硬件之间的接口

内容

指令格式，指令寻址方式，操作类型，以及每种操作对应的操作数的相应规定

操作数的类型，操作数寻址方式，以及是按大端方式还是小端方式存放

程序可访问的寄存器编号、个数和位数，存储空间的大小和编址方式

指令执行过程的控制方式

指令的基本结构

操作码字段+地址码字段

指令字长

取决于操作码的长度、地址码的长度和地址码的个数

与机器字长没有固定的关系

单字长指令

半字长指令

双字长指令

指令字长通常为字节的整数倍

为了便于存取指令，指令的长度通常为存储字长的整数倍

分类

定长指令字结构

变长指令字结构

按地址码数目分类

零地址指令

仅用在堆栈计算机中

通常参与运算的两个操作数隐含地从栈顶和次栈顶弹出，运算结果再隐含的压入堆栈

一地址指令

OP(A1)->A1

隐含约定目的地址的双操作数指令，即另一个操作数来自隐含寻址

如 (ACC)OP(A1)->A1

二地址指令

(A1)OP(A2)->A1

三地址指令

(A1)OP(A2)->A3

四地址指令

(A1)OP(A2)->A3，A4=下一条将要执行指令的地址

定长操作码指令格式

扩展操作码指令格式

可变长操作码

注意

不允许短码是长码的前缀

各指令的操作吗不能重复

指令的操作类型

数据传送

寄存器之间（MOV）

内存单元到CPU寄存器（LOAD）

CPU寄存器写数据到内存单元（STORE）

进栈操作（PUSH）

出栈操作（POP）

···

算术和逻辑运算

移位操作

转移操作

无条件转移（JMP）

条件转移（BRANCH）

调用（CALL）

返回（RET）

陷阱（TRAP）

输入输出操作

指令的寻址方式

指令寻址和数据寻址

指令寻址

顺序寻址

跳跃寻址

数据寻址

指令字

操作码 | 寻址特征 | 形式地址A

有效地址（EA）

形式地址结合寻址方式，可以计算出操作数在存储器中的真实地址

常见的数据寻址方式

隐含寻址

可简化地址结构

立即（数）寻址

寻址最快

寻址速度：立即寻址>寄存器寻址>直接寻址>间接寻址

直接寻址

EA = A

间接寻址

EA = (A)

寄存器寻址

EA = Ri

为了缩短指令中某个地址段的位数

寄存器间接寻址

EA = (Ri)

相对寻址

EA = (PC) + A

PC中保存的是下一条指令的地址

广泛应用于转移指令

基址寻址

EA = (BR) + A

基址寄存器面向操作系统

主要用于为多道程序或数据分配存储空间

变址寻址

EA= (IX) + A

变址寄存器面向用户

主要用于处理数组问题

堆栈寻址

堆栈指针（SP）寄存器

硬堆栈

操作顺序

进栈

先压入数据 (A)->MSP，然后修改指针 (SP)-1->SP

出栈

先修改指针 (SP)+1->SP，然后才能弹出数据(MSP)->A

采用不同的寻址方式目的

缩短指令字长，扩大寻址空间，提高编程的灵活性

缺点

提高了指令译码的复杂度

程序的机器级代码表示

常用汇编指令介绍