导图社区 数据库系统概论-第十一章
并发控制,详细的总结了并发控制概述,封锁,封锁协议,活锁与死锁,并发调度的可串行性,两段锁协议,封锁的粒度内容点。
编辑于2022-06-04 15:35:01并发控制
问题的产生
数据库是一个共享资源,可以供多个用户使用。允许多个用户同时使用同一个数据 库数据库系统称为多用户数据库系统。 在这样的系统中,在同一时刻并发运行的事 务数可达数百上千个。 事务可以一个一个地串行执行,即每个时刻只有一个事务运行,其他事务必须等到 这个事务结束以后方能运行。 因此,为了充分利用系统资源,发挥数据库共享资源 的特点,应该允许多个事务并行地执行。 在单处理机系统中,事务的并行执行实际上是这些并行事务的并行操作轮流交叉运 行。这种并行执行方式称为交叉并发方式。虽然单处理机系统中的并行事务并没有 真正地并行运行,但是减少了处理机的空闲时间,提高了系统的效率。 在多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事 务,实现多个事务真正的并行运行。这种并行执行方式称为同时并发方式。 当多个用户并发地存取数据库时就会产生多个事务同时存取同一数据的情况。若对 并发操作不加控制就可能会存取和存储不正确的数据破坏事务的一致性和数据库 的一致性。所以数据库管理系统必须提供并发控制机制。 并发控制机制是衡量一个 数据库管理系统性能的重要标志之一。
并发控制概述
概述
事务是并发控制的基本单位,保证事务的 ACID 特性是事务处理的重要任务。 为 了保证事务的隔离性和一致性,数据库管理系统需要对并发操作进行正确调度。这 些就是数据库管理系统中并发控制机制的责任化。 并发操作带来的数据不一致性包括丢失修改、不可重复读和读“脏”数据。
并发操作带来的数据不一致性
内容
丢失修改
两个事务 T1和 T2读入同一数据并修改,T2提交的结果破坏了 T1提交的结果,导致 T1的修改被丢失。
不可重复读
不可重复读是指事务 T1读取数据后,事务 T2执行更新操作,使 T1无法再现前一次 读取结果。具体地讲,不可重复包括三种情况。 (1)事务 T1读取某一数据后,事务 T2对其进行了修改,当事务 T1再次读该数据时, 得到与前一次不同的值。 (2)事务 T1按一定条件从数据库中读取了某些数据记录后,事务 T2删除了其中部 分记录,当 T1再次按相同条件读取数据时,发现某些记录神秘地消失了。 (3)事务 T1按一定条件从数据库中读取某些数据记录后,事务 T2插入了一些记录, 当 T1再次按相同条件读取数据时,发现多了一些记录。 后两种不可重复读有时也称为幻影(phantom row)现象。
读“脏”数据
读“脏”数据是指事务 T1修改某一数据并将其写回磁盘,事务 T2读取同一数据后, T1由于某种原因被撤销,这时被 T1修改过的数据恢复原值,T2读到的数据就与数据 库中的数据不一致,则 T2读到的数据就为“脏”数据,即不正确的数据。
原因
产生上述三类数据不一致性的主要原因是并发操作破坏了事务的隔离性。 并发控制 机制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干 扰,从而造成数据的不一致性。 并发控制的主要技术有封锁、时间戳、乐观控制法、 和多版本并发控制等。
封锁
定义
所谓封锁就是事务 T 在对某个数据对象例如表、记录等操作之前,先向系统发出 请求,对其加锁。加锁后事务 T 就对该数据对象有了一定的控制,在事务 T 释放 它的锁之前,其他事务不能更新此数据对象。
类型
基本的封锁类型有两种:排他锁(简称 X 锁)和共享锁(简称 S 锁)。 排他锁又称为写锁。若事务 T 对数据对象 A 加上 X 锁,则只允许 T 读取和修改 A, 其他任何事务都不能再对 A 加任何类型的锁,直到 T 释放 A 上的锁为止。这就保 证了其他事务在 T 释放 A 上的锁之前不能再读取和修改 A 共享锁又称为读锁。若事务 T 对数据对象 A 加上 S 锁,则事务 T 可以读 A 但不能 修改 A,其他事务只能再对 A 加 S 锁,而不能加 X 锁,直到 T 释放 A 上的 S 锁为 止。这就保证了其他事务可以读 A,但在 T 释放 A 上的 S 锁之前不能对 A 做任何 修改。
封锁协议
定义
在运用 X 锁和 S 锁这两种基本封锁对数据对象加锁时,还需要约定一些规则,这些规则称为封锁协议。
三级封锁协议
主要区别在于什么操作需要申请封锁,以及何时释放锁
一级封锁协议
一级封锁协议是指,事务 T 在修改数据 R 之前必须先对其加 X 锁,直到事务结束才 释放,事务结束包括正常结束(COMMIT)和非正常结束(ROLLBACK)。 一级封锁协 议可防止丢失修改,并保证事务 T 是可恢复的。 不能保证可重复读和不读脏数据
二级封锁协议
二级封锁协议是指,在一级封锁协议基础上增加事务 T 在读取数据 R 之前必须先对 其加 S 锁,读完后即可释放 S 锁。 二级封锁协议除防止了丢失修改,还可进一步防 止读“脏”数据。 不能保证可重复读
三级封锁协议
三级封锁协议是指,在一级封锁协议的基础上增加事务 T 在读取数据 R 之前必须先 对其加 S 锁,直到事务结束才释放。 三级封锁协议除了防止丢失修改和读“脏”数 据外,还进一步防止了不可重复读。
活锁与死锁
活锁
情形
如果事务 T1封锁了数据 R,事务 T2又请求封锁 R,于是 T2等待;T3也请求封锁 R, 当 T1释放了 R 上的封锁之后系统首先批准了 T3的请求,T2仍然等待;然后 T4又请求 封锁 R,当 T3释放了 R 上的封锁之后系统又批准了 T4的请求…T2有可能永远等待, 这就是活锁的情形。
原因
当一系列封锁不能按照其先后顺序执行时,就可能导致一些事务 无限期等待某个封锁,从而导致活锁。
解决方法
采用先来先服务的策略。当多个事务请求封锁同一数据对象 时,封锁子系统按请求封锁的先后次序对事务排队,数据对象上的锁一旦释放就批 准申请队列中第一个事务获得锁。
死锁
情形
如果事务 T1封锁了数据 R1,T2 封锁了数据 R2,然后 T1又请求封锁 R2,因 T2已封锁 了 R2,于是 T1等待 T2释放 R2上的锁;接着 T2又申请封锁 R1,因 T1已封锁了 R1,T2 也只能等待 T1释放 R1上的锁。这样就出现了 T1等待 T2,而 T2又在等待 T1的局面, T1和 T2两个事务永远不能结束,形成死锁。
解决方法的类型
死锁的预防
产生死锁的原因与预防原理
在数据库中,产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又 都请求对已被其他事务封锁的数据对象加锁,从而出现死等待。 防止死锁的发生其 实就是要破坏产生死锁的条件。
常用方法
一次封锁法
一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能 继续执行。 如果事务 T1将数据对象 R1和 R2一次加锁,T1就可以执行下去,而 T2等待。T1执行完后释放 R1、R2上的锁,T2继续执行。这样就不会发生死锁。 一次封锁法虽然可以有效地防止死锁的发生,但也存在问题,第一,一次就将 以后要用到的全部数据加锁,势必扩大了封锁的范围,从而降低了系统的并发 度;第二,数据库中数据是不断变化的,原来不要求封锁的数据在执行过程中 可能会变成封锁对象,所以很难事先精确地确定每个事务所要封锁的数据对 象,为此只能扩大封锁范围,将事务在执行过程中可能要封锁的数据对象全部 加锁,这就进一步降低了并发度。
顺序封锁法
顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实施 封锁。 顺序封锁法可以有效地防止死锁,但也同样存在问题,第一,数据库系 统中封锁的数据对象极多,并且随数据的插入、删除等操作而不断地变化,要 维护这样的资源的封锁顺序非常困难,成本很高;第二,事务的封锁请求可以 随着事务的执行而动态地决定,很难事先确定每一个事务要封锁哪些对象,因 此也就很难按规定的顺序去施加封锁。
死锁的诊断与解除
超时法
如果一个事务的等待时间超过了规定的时限,就认为发生了死锁。超时法实现 简单,但其不足也很明显,一是有可能误判死锁;二是时限若设置得太长,死 锁发生后不能及时发现。
等待图法
事务等待图是一个有向图 G=(T,U),T 为结点的集合,每个结点表示正运行 的事务;U 为边的集合,每条边表示事务等待的情况。 若 T1等待 T2,则在 T1、 T2之间画一条有向边,从 T1指向 T2 事务等待图动态地反映了所有事务的等待情况,并发控制子系统周期性地生成 事务等待图,并进行检测。 如果发现图中存在回路,则表示系统中出现了死锁。 数据库管理系统的并发控制子系统一旦检测到系统中存在死锁,就要设法解 除。 通常采用的方法是选择一个处理死锁代价最小的事务,将其撤销,释放此 事务持有的所有的锁,使其他事务得以继续运行下去
并发调度的可串行性
可串行化调度
多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这 些事务时的结果相同,称这种调度策略为可串行化调度。 可串行性是并发事务正确调度的准则。按这个准则规定,一个给定的并发调度,当 且仅当它是可串行化的,才认为是正确调度。
冲突可串行化调度
冲突操作是指不同的事务对同一个数据的读写操作和写写操作: Ri(x)与 Wj(x) /*事务 Ti读 x,Tj写 x,其中 i≠j*/ Wi(x)与 Wj(x) /*事务 Ti写 x,Tj写 x,其中 i≠j*/ 其他操作是不冲突操作。 不同事务的冲突操作和同一事务的两个操作是不能交换的。 一个调度 Sc 在保证冲突操作的次序不变的情况下通过交换两个事务不冲突操作的 次序得到另一个调度 Sc',如果 Sc’是串行的,称调度 Sc 为冲突可串行化的调度。 若一个调度是冲突可串行化,则一定是可串行化的调度。因此可以用这种方法来判 断一个调度是否是冲突可串行化的。 应该指出的是,冲突可串行化调度是可串行化调度的充分条件,不是必要条件。
两段锁协议
两段锁协议的定义
所谓两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁。 1 在对任何数据进行读、写操作之前,首先要申请并获得对该数据的封锁; 2 在释放一个封锁之后,事务不再申请和获得任何其他封锁。
两段锁的含义
所谓“两段”锁的含义是,事务分为两个阶段, 第一阶段是获得封锁,也称为扩展 阶段,在这个阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释 放任何锁; 第二阶段是释放封锁,也称为收缩阶段,在这个阶段事务可以释放任何 数据项上的任何类型的锁,但是不能再申请任何锁。
与可串行化调度的关系
可以证明,若并发执行的所有事务均遵守两段锁协议,则对这些事务的任何并发调 度策略都是可串行化的。 需要说明的是,事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。 也就是说,若并发事务都遵守两段锁协议,则对这些事务的任何并发调度策略都是 可串行化的;但是,若并发事务的一个调度是可串行化的,不一定所有事务都符合 两段锁协议。
与一次封锁法的区别
两段锁协议和防止死锁的一次封锁法的异同之处:一次封锁法要求每个事务必须一 次将所有要使用的数据全部加锁,否则就不能继续执行。因此一次封锁法遵守两段 锁协议;但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因 此遵守两段锁协议的事务可能发生死锁。
封锁的粒度
概述
封锁对象的大小称为封锁粒度。封锁对象可以是逻辑单元,也可以是物理单元。以 关系数据库为例,封锁对象可以是这样一些逻辑单元:属性值、属性值的集合、元 组、关系、索引项、整个索引直至整个数据库;也可以是这样一些物理单元:页(数 据页或索引页)、物理记录等。 封锁粒度与系统的并发度和并发控制的开销密切相关。直观地看,封锁的粒度越大, 数据库所能够封锁的数据单元就越少,并发度就越小,系统开销也越小;反之,封 锁的粒度越小,并发度较高,但系统开销也就越大。 因此,如果在一个系统中同时支持多种封锁粒度供不同的事务选择是比较理想的,这种封锁方法称为多粒度封锁。 选择封锁粒度时应该同时考虑封锁开销和并发度两 个因素,适当选择封锁粒度以求得最优的效果。一般说来,需要处理某个关系的大 量元组的事务可以以关系为封锁粒度;需要处理多个关系的大量元组的事务可以以 数据库为封锁粒度;而对于一个处理少量元组的用户事务,以元组为封锁粒度就比 较合适了。
多粒度封锁
多粒度树
多粒度树的根结点是整个数据库,表示最大的数据粒度。叶结点表示最小的数据粒 度。图 11.10 给出了一个三级粒度树。根结点为数据库,数据库的子结点为关系, 关系的子结点为元组。也可以定义 4 级粒度树,例如数据库、数据分区、数据文件、 数据记录。
多粒度封锁协议
多粒度封锁协议允许多粒度树中的每个结点被独立地加锁。 对一个结点加锁意味着 这个结点的所有后裔结点也被加以同样类型的锁。因此,在多粒度封锁中一个数据 对象可能以两种方式封锁,显式封锁和隐式封锁。 显式封锁是应事务的要求直接加到数据对象上的锁; 隐式封锁是该数据对象没有被 独立加锁,是由于其上级结点加锁而使该数据对象加上了锁。
意向锁的产生背景
多粒度封锁方法中,显式封锁和隐式封锁的效果是一样的,因 此系统检查封锁冲突时不仅要检查显式封锁还要检查隐式封锁。 一般地,对某个数据对象加锁,系统要检查该数据对象上有无显式封锁与之冲突; 再检查其所有上级结点,看本事务的显式封锁是否与该数据对象上的隐式封锁(即 由于上级结点已加的封锁造成的)冲突;还要检查其所有下级结点,看它们的显式 封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突。 显然,这样的检查 方法效率很低。为此人们引进了一种新型锁,称为意向锁。
意向锁
定义
意向锁含义是如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁;对 任一结点加锁时,必须先对它的上层结点加意向锁
常见的意向锁
IS锁
如果对一个数据对象加 IS 锁,表示它的后裔结点拟(意向)加 S 锁。
IX锁
如果对一个数据对象加 IX 锁,表示它的后裔结点拟(意向)加 X 锁。
SIX锁
如果对一个数据对象加 SIX 锁,表示对它加 S 锁再加 IX 锁,即 SIX=S +IX。
锁的强度
所谓锁的强度是指它对其他锁的排斥程度。一个事务在申请封锁时以强锁代替弱锁 是安全的,反之则不然。
申请与释放封锁的要求
在具有意向锁的多粒度封锁方法中,任意事务 T 要对一个数据对象加锁,必须先对 它的上层结点加意向锁。 申请封锁时应该按自上而下的次序进行,释放封锁时则应 该按自下而上的次序进行。