导图社区 数据业务连续性规划要求和灾备方案培训
数据业务连续性规划要求和灾备方案培训,包括业务影响分析,预防性措施,恢复战略,业务流程恢复,业务连续性步骤等等内容。
编辑于2023-02-21 22:47:35 广东数据业务连续性规划要求和灾备方案培训
业务连续性规划要求
业务影响分析
BIA步骤
选择收集数据时需要采访的人员
确定数据收集方法(调查、问卷、定性和定量方法
确定公司的关键业务功能
确定这些功能所依赖的资源
如缺乏上述资源,那么就计算机这些功能能够存活多久
标识针对这些功能的脆弱性和威胁
为每种业务功能计算风险
为每种业务功能计算风险
记录结束,并向管理层报告
最大可容忍故障时间(Maximum Tolerable Downtime,MTD)
相互依赖
解决依赖性
定义必不可少的业务功能和支持部门
确定这些功能和部门之间的相互依赖关系
找出所有可能对这些部门协调工作所需机制造成营销的破坏因素
表示和记录可能破坏部门间通信的潜在威胁
收集与这些威胁有关的定性和定量信息
提供还原功能和通信的备用方法
简要说明每种威胁和相应信息的基本原理
管理层职责
全面支持业务连续性计划
设定策略和目标
提供必要的资金和资源
承担业务连续性计划制定责任
为计划制定过程任命一个团队
BCP团队职责
确定必须满足的法律法规要求
标识所有可能的脆弱性和威胁
估计这些威胁和潜在损失发生的几率
执行业务影响分析
说明哪些部门、系统和流程必须首先正常运转
制定灾难发生后恢复业务的措施和步骤
预防性措施
设施建筑材料的强化
冗余服务器和通信链接
从不同变压器接入的电源线路
冗余供应商支持
购买保险
购买UPS和发电机
数据备份技术
介质保护防范措施
增加关键设备的存货
火灾探测和灭火系统
恢复战略
业务流程恢复
设施恢复
攻击和技术恢复
用户环境恢复
数据恢复
业务流程恢复
需要的角色
需要的资源
输入和输出机制
工作流程步骤
需要完成时间
与其他流程的接口
设施恢复
破坏类型
非灾难
因设备故障或失灵造成的服务中断
解决:硬件、软件或文件还原
灾难
整个设施一整天或更长时间无法使用的事件
对策:需要使用备用处理设施、软件还原以及根据异地副本还原数据
大灾难
完全摧毁设施的重大破坏
短期方案,异地设备
长期方案:重建原有设施
异地租用设施
完备场所(hot site)
是一种租用设施,它已经配置妥当,在几个小时内就可以投入运行
完备场所唯一缺乏的资源是数据(数据要从一个备份站点检索得到)和处理数据的人员
这里的设备和系统软件必须与主站点还原的数据完全兼容,决不能到时任何负面的互用性问题
支持公司进行的一年一度的检查,以确保机器处于必要的工作状态
最昂贵
优点
几小时内即可投入运行
高度的
可用性
常用于短期解决方案而非长期解决方案
可以进行年度检查
缺点
非常昂贵
硬件和软件的选择有限
基本完备场所(warm site)
租用设施,只进行不分配至,使用一些设备,但并非实际的计算机
通常是一个没有配备昂贵设备的完备场所,
在一个设置中配置和主站点完全一样的硬件和计算机后可立即投入运行
基本场所提过一个配备一些外围设施的备用场所
优点
比较便宜
由于成本较低,因此可以使用较长时间
如果使用所有权硬件或软件,那么基本场所和基础场所更为实用
缺点
不能立即投入使用
不能进行年度运行测试
不能立即获得运行所需的资源
基础场所(cold site)
它提供基本的环境、电源线路、空调管道和地板,但不影响设备或其他服务
可能具有设备架和暗光纤
第三站点
是一个次要的备份站点,目的是为了在主要备份站点失效时使用
异地场所
互惠协议
建立异地备用设施的另一种方式是与另一家公司签订互惠协定(reciprocal agreement),也称相互援助
是一种短期解决方案
最多只是灾难保护的次要选择
互惠协定不是强制性的
荣誉场所(redundant site)
一个设备和配置与主站点完全相同的场所,并且将其作为一个荣誉环境
Subtopic
滚动完备场所(rolling hot site)或移动完备场所)
应急通信车等
多处理中心(multiple processing center)
一个组织机构可能在世界各地拥有十处不同的设施,它们可能拥有一些产品和技术
供给和技术恢复
备份的内容
网络和计算机设备
语音和数据通信资源
人力资源
设备和人员的运送
环境问题(HVAC)
数据和人员安全问题
供给(纸张、表格、线缆等)
文档记录
硬件备份
网络设备、计算机工作站等
异地场所,购买设备,确定依赖的供应商
备份磁带技术
数字线性磁带
数字音频磁带
高级智能磁带
软件备份
应用程序、实用工具、数据库和操作系统
BCP团队至少为公司的操作系统和关键应用程序准备两个副本,一份保存在现场,一份保存在安全的异地
并定期对这些副本进行测试,如有新版本推出,应重建这些版本
软件托管(software cscrow)
一种保护机制,由第三方机构保存源代码、编译代码备份、手册以及其他支持材料
软件供应商、客户和第三方机构应签署一份合约
文档
包括
如何安装镜像
如何配置操作系统和服务器以及如何正确安装使用工具和专用软件
一章联系人表
特定供应商、紧急事件处理机构、异地设施和在危急之时可能需要联系的其他任何实体的联系信息
文档保护也是灾难恢复和业务连续性计划的基本组成部分
所有文档将保持最新并得到适当保护
组织机构可能需要巩固通信渠道,并加强与政府官员和应急小组的关系
人力资源
管理人员继任规划(executive succession planning)
两名或多名高级职员不能同时面临某个特定的风险
终端用户环境
了解用户需求
数据备份选择方案
操作团队定义数据备份的方法和频率
完全备份full backup
对所有数据进行备份,并将其保存在某种存储介质上
在完全备份过程中,归档位会被清除,设为0
备份和恢复的时间会很长
差量备份(differential process)
对最近完全备份依赖发送改变的文件进行备份
需要还原数据时,首先恢复完全备份,然后在此基础上应用最新的差量备份
差量备份并不改变归档位的值
增量过程(incremental process)
对最近完全备份或增量备份依赖发送改变的所有文件进行备份,并将归档位设为0
Subtopic
完全备份可以与差量备份或增量备份一起使用
差量和增量备份不能混合使用,这种重叠会导致文件丢失,因为增量会改变归档位,而差量备份不会
关键数据应在现场和异地两处保留备份
电子备份解决方案
磁盘映像
用于确保数据的可用性,并通过复制和维护几份消息副本来提供容错解决方案
以动态方式创建数据
磁盘映像提供在线备份存储功能,可以减少或替代定期离线手动备份操作的需要
提高读取操作的性能
为复制数据提供多条路径,而且一个映像组能并行执行多个读取请求
昂贵
提供容错功能
电子传送
批量进行,传送发生变化的整个文件
文件发生改变时进行备份,再定期将它们传送到一个异地备份站点
传输部实时进行,而是批量进行
远程日志
处理实时发生
电子链接是一种为实现备份而向异地设施传送批量信息的方法
远程日志(remote joumaling)是另一种离线数据传输办法
这种方法只将日志或事务处理日志传送到异地设施,而不传送实际的文件
磁带传送(tape vaulting)
间数据备份到磁带上,由员工运输到异地设施
自动磁带传送)
数据通过一条串行线路传送到异地设施的备份磁带系统中,维护异地设施的公司对这个系统进行维护
并在必要时更换磁带
电子磁带传送
将数据通过网络传输到位于备用数据中心的磁带设备中
提高了恢复速度,减少了错误,并可以频繁进行备份
选择软件备份设施
BCP项目团队需要根据快速恢复的重要性来划分数据
需要保证持续有效的重要数据可以通过电子传送(或远程日志处理)还原
其他数据可以通过磁带或镜像系统还原
异步复制
指的是主要数据和次要数据仅超出同步范围几毫秒,因此复制几乎实时进行
使用同步复制时,得到的主要副本和次要副本总是完全相同,因此它可以提供真正实时的复制,
异步表示复制并不实时,如同在电子传送和批量作业一样
BCP团队必须在恢复成本和停机成本之间取得平衡,平衡点即恢复时间目标
保险
转移风险
购买保险
网络保险(cyberinsurance)
是一种新型的保险项目,它为由拒绝服务供给、恶意软件破坏、黑客、电子盗窃、与隐私有关的烦了诉讼以及其他事件造成的损失提供保险
业务中断保险(business interruption insurance)
每年对购买保险进行审核
适当关注
恢复与还原
组建团队类型
破坏评估团队
确定灾难原因
确定进一步破坏的可能性
标识受到影响的业务功能和领域
标识关键资源的可用程度
标识必须立即替换的资源
估计需要多久才能恢复关键功能
如果还原过程超过事先评估的MTD值,那么立即生命为灾难,并且立即启动BCP
法律团队
媒体关系tuandui
网络恢复团队
重建部署团队
重建团队
负责使备用站点投入运行
救援团队
负责开始恢复原始站点
安全团队
通信团队
准则
对人员生命的威胁
对州或国家安全的威胁
对设施的破坏
对关键系统的破坏
公司将经历的估计停工时间
完成破坏评估并启动恢复计划,进入恢复阶段
首先恢复关键功能
公司进入再造阶段(reconstitution phase)
确保员工安全
保证提供一个适度的环境(电源、基础设施、供水、HVAC)
保证提供必要的良好设备和供给
保证应用正确的通信和连接方法
新环境得到正确测试
救援团队
从备用站点备份数据并在新设施内进行恢复
小心终止应急操作
将设备和人员安全运行到新设施
首先,转移最不关键的功能
总结BCP团队步骤
提出连续性规划策略声明
说明BCP的作用域和目标以及BCP团队的职责
执行业务影响分析(BIA)
标识关键业务功能、他们的资源和MTD值
标识威胁并计算这些威胁的应先
确定解决方案
向管理层提交结果
确定和实现预防性控制
实施控制,降低公司已标识的风险
购买更多保险,执行基础设施加固,提出数据备份解决方案,安装冗余和容错机制等
制定恢复战略
在必要时实现使公司恢复正常运作的过程
组件必要的团队,为每个团队制定目标和措施,建立通告步骤和计划启动准则,确定备用的备份解决方案等
需要将这些机会投入运行,测试计划,培训人员
为计划制定目标
责任
每个参与恢复和连续性计划的个人都应当将他们的责任以书面形式列出,以便在混乱时能够明确自己的责任
通过培训、演习、通信和文档来培养意识
权威
在危急时刻,制定由谁负责最重要
明确权威有助于减少混乱,促进合作
优先级别
了解哪些是关键工作,哪些是次要工作
实现和测试
演习,测试,实现
实现战略
整理文档,电子版本等,保存备份,异地等
单独计划
业务恢复计划
操作连续性计划
IT应急计划
紧急通信计划
网络事故响应计划
灾难恢复计划
场所应急计划
测试和审查计划
概念
定期对业务连续性计划进行测试
测试
核查性测试
BCP的副本被分发至不同部门和职能区域接受审查
各部门完成审核并提出建议,计划团队奖这些变化整合到主计划中
结构化的排练性测试
各部门或只能区域的代表聚集在一起对计划进行检查,以保证它的准确性
代表们审查计划的目标,讨论计划的作用域和射向,检查阻止和报告结构,以及评估计划锁描述的测试、维护和培训要求
这些代表必须从头至尾将计划的不同场景演练一次,保证没有遗漏任何项
从而提高团队成员对恢复程序的认识
模拟测试
模拟场景进行测试
参与人员更多
并行测试
用于确保特定系统在备用异地实施中能充分地发挥其功能
某些系统需要移动到备用场所并开始进行处理,记过和原来进行的正常处理结果进行比较,这可以指出任何避孕的的挑战、重新配置或需要采取的步骤
全中断测试
将原始站点关闭并将其业务处理转移到备用站点完成
获得最高管理层批准
其他类型培训
灾难恢复培训
急救、心肺复苏术(CPR)
如何正确使用灭火器、疏散路线和人群控制方法
紧急通信程序以及在面临不同灾难事件是如何正确地关闭设备
技术员工了解冗余电源使用方法等
应急响应
人身安全至关重要
报警
顺序关闭系统,并在疏散时带走关键的数据文件或资源以及贵重的个人物品等
维护计划
计划变更的原因
业务连续性过程没有整合入变更管理过程
基础架构和环境发生变化
公司进行重组、裁员或合并
硬件、软件和应用程序发生变化
制定计划后,人们认为没有必要再做其他的工作
人员发生更换
大型计划要进行许多维护工作
计划比直接带来利润
保持计划更新
是业务连续性称为每个业务决策的一部分
将维护责任整合入职位描述
将维护工作表现包含在个人评估中
执行包括灾难恢复、连续性文档与措施的内部审计
执行应用计划的常规演习
将BCP整合入当前的变更管理过程
最划算和最简单的方法
DRP和BCP都具有生命周期
业务连续性与灾难恢复
概述
灾难恢复的目标
将灾难造成的损失降低到最低程度
并采取必要的步骤保证资源、人员和业务流程尽快恢复运作
灾难恢复在灾难发生之后立即采取行动处理灾难及其造成的后果
灾难恢复计划往往非常关注信息技术(IT)
业务连续性计划(Business Continuity Plan,BCP)
主要为长期停产和灾难事件提过方法和措施
从更长远的角度来解决问题
业务连续性计划规则
立即对紧急情况作出适当响应
保护生命并确保安全
减少灾难对业务的影响
恢复至关重要的业务功能
在恢复期与外界供应商合作
减轻危机情况下的混乱状态
在灾难后寻夫恢复正常运行
让业务合作伙伴知道公司已为应对灾难做好准备
让股东和托管委员会对公司的准备就绪情况感动放心
如果行业法规要求,那么需要确保制订了业务连续性计划(BCP)
业务连续性步骤
美国NIST制定SP 800-34标准
制定连续性计划策略声明:编写一份策略,为制定BCP提供必要的指导,并给权威机构分配必要的职位来完成这些任务
执行业务影响分析(Business Impact Analysis,BIA)
标识关键功能和系统,允许组织机构根据需求排定优先次序。标识脆弱性、威胁,并计算风险
确定预防性控制方法:识别危险后,制定并实现控制方法和应对措施,以经济低廉的方式降低组织机构的风险级别
制定恢复战略:阐明恢复方法,以确保能够迅速恢复系统和关键功能
制定应急计划:编写措施和指导原则,使组织机构在危急情况下仍然正常运转
维护业务连续性计划:采取必要的步骤保证BCP得到定期更新
总结
业务连续性计划应当成为安全纲要和业务决策的一部分,而不是独立存在
如与变更管理过程适当整合,那么更可能得到持续更新和完善
项目起始阶段
BCP委员会组成
业务单位
高级管理层
IT部门
安全部门
通信部门
法律部门