导图社区 数据库全国计算机等级考试-三级和四级
数据库考试,全国计算机等级考试-数据库,适用于三级和四级数据,大家可以学起来哦。
编辑于2023-03-21 23:19:12 青海省全国计算机等级考试-数据库 适用于三级和四级数据
第一章 数据库应用系统开发方法
一.系统规划与定义
1、任务陈述
2、确定任务目标
3、确定系统范围和边界
4、确定用户视图
二.可行性分析
1、经济可行性
2、技术可行性
3、操作可行性(各种人员资源,常考选择题)
4、开发方案选择
三、数据字典
1、数据项
2、数据结构
3、数据流
4、数据存储
5、处理过程
四、数据处理需求(事物规范)
1、事务名称
2、事物描述
3、事务所访问的数据
4、事物用户
五、性能指标
1、数据操作响应时间
2、系统吞吐量
3、允许并发访问的最大用户量
4、每TPS带价值。用于衡量系统性价比的指标。
六、系统设计
1、概念设计(ER图)
2、逻辑设计(ER图转关系模式):包括数据库逻辑结构设计、应用程序概要设计、数据库事务概要设计
3、物理设计(具体实现)
七、实现与部署
1、建立数据库结构
2、数据加载
3、事务和应用程序的编码和测试
4、系统集成、测试与试运行
5、系统部署
第二章 需求分析
一、获取需求的方法
1.面谈
2.实地观察
3.问卷调查
4.查阅资料
二、软件需求说明书
1.需求概述
2.功能需求(常考功能需求和非功能需求)
3.信息需求
4.性能需求
5.环境需求(运行环境)
6.其他需求
三、三种需求分析方法
1.DFD建模方法:过程建模和功能建模方法
数据流(核心)
处理
数据存储
外部项(数据源及终点)
IDEF0 方法
IDEF0 的基本思想也是结构化分析,强调自顶向下有控制地逐步地展开细节,精确、准确、全面地描述系统,通过建模过程与模型来理解一个系统。模型由图形、文字说明、词汇表及相互的交叉引用表组成, 图形是其主要成分。
组成 IDEF0 图的基本元素是矩形框和箭头
UML用例模型
UML 方法采用面向对象思想建模,其中的用例模型用于描述系统功能需求
UML 的用例模型由用例图组成,用例图由系统、角色和用例三种模型元素及其之间的关系构成。
第三章 数据库结构设计
一、数据库概念设计
ER建模方法(第一大题)
IDEF1X建模方法
实体集:
独立实体集(矩形框)
从属实体集(圆角矩形框)
二、数据库逻辑设计(ER图转关系模式)
三、数据库物理设计
1.索引
1.有序索引
1.聚集索引/非聚集索引:排列顺序相一致/不一致
2.稠密索引与稀疏索引“每个查找吗都对应一个索引记录/只是一部分对应
3主索引与辅助索引:建立在主键上火非主键上
唯一索引:确保索引列不包含重复的值
单层索引与多层索引
2.散列索引
2.物理设计内容
1.数据库逻辑模式描述(关系模式转换成基本表)
2.文件组织与存取设计
3.数据分布设计
4.确定系统配置
5.物理模式评估
4.基本表选择合适的文件结构原则
1.堆文件:数据量少,更新频繁
2.顺序文件:查找条件在查找码上
3.散列文件:访问顺序随机,并没有一下情况:
a.基于散列域进行查询
b.基于非散列域进行的查询
4.B-树和B+树文件:大数据量的基本表、等值查询、范围查询、模糊查询、部分查询
5.聚集文件:频繁执行且进行夺标链接操作的查询
第四章 数据库应用系统设计与实现
一、DBAS体系结构设计
1.客户/服务器体系结构(两层C/S)
2.浏览器/服务器结构(三层B/S)
表示层:位于客户端
功能层:位于Web应用服务器
数据层:位于数据库服务器
二.DBAS功能概要设计
从功能角度划分
1.表示层:进行人机界面设计
2.数据逻辑层:梳理DBAS的各项业务活动,减去表位为各种系统结构。传输数据的作用。高内聚,松耦合原:、
a.单一责任原则
b.各个构件均应具有独立的功能
c.构件之间的接口应尽量简单明确
d.构件之间关系比较复杂,进一步模块划分
e.构件间关系过于复杂,细分
3.数据访问层:设计操作数据库的事物。负责与DBMS系统进行交互。
4.数据持久层:进行应用系统的存储结构设计。保存和管理应用系统数据。
事物设计:
1.事物规范(数据处理要求):事物名称、事物描述、事物所访问的数据项、事物用户等
2.两个元操作:read、write
3.事物隔离级别越高,安全性越高,性能越低,同时事物的隔离级别和数据库并发性是对立的。
4.数据库的一致性:事物执行成功则全部提交,如果一个事物提交失败,则做过的所有更新则全部撤销。
三.安全架构设计
1.数据安全设计
数据库的安全性保护:
a.用户身份鉴别
b.权限控制
c.视图机制
数据库的完整性保护:
完整性:是指数据库中数据的正确性、一致性、相容性
方法:设置完整性检查。检查数据表时(select等)不会检查数据的完整性约束。
两段锁协议:指所有事物必须分两个阶段对数据项枷锁和解锁
1.在对任何数据进行读、写操作直线,要申请并获得对该数据的封锁
2.在释放一个封锁之后,事物不再申请和获得其他任何封锁
一次封锁法:要求每个事物必须一次将所有要使用的数据全部加锁。一次封锁法遵守两段锁协议,但 两段锁协议并不要求一次全加锁。
三级加锁协议:保证数据的一致性。
检测死锁:检测事物等待图是否出现回路。
数据并发控制:
封锁技术:排它锁(X锁)、共享锁(s锁)
避免死锁的方法:
a.按同一顺序访问资源
b.避免事物中的用户交互
c.采用小事物模式,尽量缩短事物的长度,减少占用锁的时间
d.尽量使用记录级别的锁(行锁),少用表级别的锁
e.使用绑定链接,使同一应用程序锁打开的两个或多个链接可以相互合作。
数据库的备份与恢复
a.双击设备
b.数据转储
c.数据加密存储
数据加密传输
a.数字安全证书
b.对称密匙加密
c.数字签名
d.数字信封
2.环境安全设计
漏洞与补丁
计算机病毒保护
a.安装杀毒软件,定期查杀病毒
b.计算机实时监控
网络环境安全
a.防火墙
b.入侵检测系统
c.网络隔离
物理环境安全
四、DBAS实施
1、创建数据库
a.初始空间大小
b.数据库增量大小
c.访问性能
2、数据装载
a.筛选数据
b.转换数据格式
c.校验数据
3、编写与调试应用程序
4、数据库系统试运行
a.功能测试
b.性能测试
第五章 UML与数据库应用系统
UML四层建模概念框架
1、元元模型层
2、元模型层
3、模型层
4、用户模型层
13种图
结构图(静态)6种:类图、对象图、符合结构图、包图、组件图、部署图。【类对复包组部】
对象图:系统某个时间的所有对象的快照
复合结构图:最主要元素:部件
包图:用于表达系统中不同的包、命名空间或不同的项目间彼此关系的图。
组件图:表示系统的静态实现视图,展现组件之间的组织和依赖。
部署图:描述系统运行时的结构,展现硬件的配置及其软件如何部署。只有一个部署图,可以帮助理解分布式系统。
行为图(动图)7种:用例图、顺序图、通信图(协作图)、交互概述图、时间图、状态图、活动图【用顺通交时状活】
用例图:主要组成:用力、角色、系统。用例之间的关系:扩展、使用、组合
顺序图:强调时间。用于描述系统内部的动态结构,主要用于描述系统内对象之间的消息发送与接收序列。
通信图(协作图):强调空间。表达对象之间的联系以及对象间发送和加收消息的图
交互概述图“活动图为基础
时间图:作为状态图的辅助和说明工具
状态图:描述一个对象再起生存期内的动态行为,状态间的转移。状态之间的转移是由事件驱动的。
活动图:描述系统、用例、程序模块中逻辑流程的先后执行次序。
第六章 高级数据查询
一、一般查询
1、使用TOP限制结果集 distinct TOP n Percent with ties
distinct:不重复的
percent:使用%显示
with ties:取并列结果
2、case函数
3、将查询结果保存到新表中
select 列名 into 新表名 from ...
临时表区别:局部临时表(#table)、全局临时表(## table)
二、查询结果的并、交、差运算
并:UNION:将两表进行垂直链接
交:INSTERSECT:取两表相交部分
差:EXCEPT:表1-表2
交并差运算与join链接不同的是join是水平合并数据,交并差运算则是垂直合并数据
三、子查询
不相关子查询(先内后外,不依赖):
IN 与 NOT IN
比较运算符
相关子查询(先外后内)
EXISTS与NOT EXISTS
四、聚合函数与开窗函数
聚合函数:SUM、COUNT、AVG、MIN、MAX。count(*)/count(列名)区别:不过滤null/过滤null
开窗函数:OVER partition by order by
聚合开窗函数
SUM(列名) OVER (PARTITION BY 列名)
排序开窗函数
RANK():有重复,但不连续排名
DENSE_RANK():有重复但连续排名
NTILE(n):分组切片,切分成n片
ROW_NUMBER():行号
五、派生表与公用表
1、派生表(内联视图):如 (select * from table ) as 表名
2、公用表:如 WITH公用表名(列名) as( select * from table)
第七章 数据库及数据库对象
一、创建及维护数据库
系统数据库(自动创建和维护的)
master:最重要的数据库,记录所有系统级信息,主要的信息都放在这里
msdb:保存报警、作业、操作员等信息
model:所有创建数据库的模板
tempdb:临时数据库,每次启动sql都会重新创建,因此不需要备份。用户创建的局部和全局临时表均被自动放置在该数据库中。
resource:只读数据库
用户数据库(用户创建和维护)
承担应用数据库。常考如何备份。
数据库文件分类
数据文件:主要数据文件:每个库中只有一个,第一个数据文件,推荐扩展名:mdf 次要数据文件:可以有0-n个,推荐扩展名:ndf
总结:主要数据文件有且只有一个,次要数据文件可以有0个或多个,可以建立在多个磁盘上。两者对用户来说没有区别。在多个不同的磁盘中建立多个数据文件,有利于利用存储空间,以及提高数据的存取效率。
日志文件:每个数据库至少有一个日志文件,推荐扩展名:ldf
数据库存储空间的分配
数据库的存储分配单位是数据页,其中一数据页的大小是8k。一行数据不能存储在不同的数据页中(行不能跨页存储)
常考填空题:一个数据表中n行数据,每行m字节,则需要多少MB的存储空间,以及空间利用率是多少? 解法:一页数据可以存储 8k/m=b 行整数行数据,n行数据需要a页,则需要空间8aMB空间利用率=每页数据页实际使用的空间,除以一页数据页总共的空间=b行*m字节/8k
文件组
主文件组:一个数据库只有一个默认文件组,一般默认为Paimary,存放主要数据文件和未明确分配文件组的次要数据文件。
特别注意:
日志文件不存放在文件组中,日志空间与数据空间是分开管理的。
一个文件不可以是多个文件组成员。
创建数据库
create database db_name on [文件组] ( ) log on ( )
修改数据库
扩大数据库的两种方法
一:add添加数据文件
添加数据文件 alter database db_name add file ()
添加日志文件:alter database db_name add log file ()
添加文件组:alter database db_name add filegroup group_name
二:modify
alter database db_name modify file (name = 逻辑名 ... size= filerowth= )
子主题
收缩数据库空间的两种方法
一:收缩整个数据库大小:DBCC shrinkdatabase(database_name,大小)
二:收缩数据库中某个文件的大小:DBCC shrinkfile(file_name,大小)
删除数据库文件
alter database db remove file file_name
分离和附加数据库
分离:从SQL server实例中删除,但不删除数据库中的数据文件和日志文件。
EXEC sp_detach_db 'db_name','true'
附加:创建一个新的数据库
常考选择题:分离数据库是否需要停止数据库
1.在分离前,必须先断开所有用户与该数据库的链接
2.分离数据库会分离数据文件和日志文件
3.分离和附加的位置可以不同
4.分离操作不能停止SQL server服务
二、架构schema
架构:逻辑命名空间,是一个数据库对象的容器。架构相当于文件夹(不能同名,可以有多个),对象相当于文件(不同文件夹下的文件可以同名)
CASCADE:所有架构对象一起全部删除
RESTRICT:包含架构对象则拒绝
创建架构:
create schema 架构名 authorizetion 用户名
删除架构:
drop schema 架构名
三、分区表
a.分区表是水平划分的子集
b.优点:可以快速且有效地管理和访问数据子集
子主题
c.是否创建分区表?主要取决于表当前的数据量大小以及将来的数据量大小,同时还取决于对表中数据进行的操作
d.物理上将一张大表分成几张小表,逻辑上还是大表
创建分区两大步骤
创建分区函数:告诉数据库管理系统以什么方式对表进行分区
create partition function pf_name(数据类型) as range [left] for values (分段1,分段2,分段3)
创建分区方案:将分区函数生成的分区映射到文件组中
create partition scheme ps_name as partition pf_name to(文件组1,文件组2,文件组3,文件组4) PS:指定的文件组数一定要大于或等于分区函数锁划分的分区数
四、索引
UNIQUE:唯一索引
CLUSTERED:聚集索引
创建唯一聚集索引:CREATE UNIQUE CLUSTERED INDEX index_name on table_name(cname)
对索引键值进行升降序排序:CREATE INDEX index_name on table_name(cname1 asc,cname2 desc )
删除索引:drop index index_name
NONCLUSTERED:默认选项,非聚集索引
五、索引视图
标准视图结果集并不存储,频繁使用会导致开销很多,因此可以对试图创建唯一聚集索引的方式来提升性能。
对视图创建唯一聚集索引后,视图的结果集将存储 成为物化视图(又叫索引视图)
创建索引视图必须用with schemabinding
create view view_name with schemabinding as select cname from table_name go
创建唯一聚集索引 create unique clustered index index_name on view_name(cname) go
关键字
需要死记得关键字: primary(主要的)、create(创建)、filegrowth(增长)、modify(修改)、alter(改变)、DBCC、shrinkdatabase(收缩数据库)、shrinkfile(收缩文件)、remove(移除)、EXEC(执行)、 sp_detach_db(分离数据库)、DROP、schema(架构)、scheme(方案)、partition(划分)、
第八章 数据库后台编程技术
一、存储过程
创建存储过程
create procedure proc_name @param data_type,..., @param2 type output as T-SQL代码
执行存储过程
declare @x int,@y int EXEC proc_name @x,@y output
删除存储过程
DROP proc proc_name
二、函数
创建标量函数
CREATE FUNCTION fun_name(@param) return type as begin declare @x int T-SQL 语句 return @ end
创建内联表值函数
create function fun_name(@param) return table as return (T-SQL)
创建多语句表值函数
删除函数
drop function fun_name
存储过程与函数的区别
1.存储过程相当于对负责T-SQL进行预编译封装
2.用户自定义函数相当于其他编程语言中的函数方法 存储过程与函数的区别: 1.声明时存储过程参数不需要使用括号,并且输出参数后使用output 2.用户自定义函数必须有return返回值 用户自定义函数一般使用begin end把T-SQL包裹起来
函数的区别(不同): 1.标量函数返回的是一个值 2.内联表值函数返回的是表,类似于视图,并且一般不适用begin和end 3.多语句表值函数返回的是新定义的表
函数的相同点: 1.创建语句基本相同,不同的是返回类型 2.调用方法相同
三、触发器
一种特殊的存储过程,不需要由用户来调用,自动触发执行
CHECK五种约束类型
主键约束、外键约束
唯一约束、缺省约束、检查约束
触发器使用场景
1.完成比check约束更复杂的数据约束
2.为了保证数据库性能而维护的非规范化数据
3.可以实现复杂商业规则
4.触发器也可以评估数据修改前后的表状态,并根据其差异采取对策
三种触发器
1.DML触发器
2.DDL触发器
创建触发器 create trigger trigger_name on table for | after | instead of as T-SQL
3.登录触发器
触发器的区别
1.FOR 或AFTER 后触发型(1个操作可以有多个后触发器)
2.INSTEAD OF 前触发型(一操作只能有1个前触发器)
特殊临时表
INSERTED表
插入的数据,,update是先删除再插入,update后的是插入的在INSERTED中
DELETED表
删除的数据,update是先删除再插入,update前的在DELETED中
四、游标
声明游标-->打开游标-->提取游标-->关闭游标-->释放资源
关键字:
procedure(程序)、declare(声明)、execute(执行)、trigger(触发)、ROLLBACK(回滚)、for after (后触发型)、instead of (前触发型)
第九章 安全管理
一、登录账户
创建登录账户:create login logini_name [ with | from ] windows 用户名 | password=''
修改登录账户:alter login login_name enable | disable
删除:drop login login_name
二、数据库用户
建立数据库用户create useruser_name
删除数据库用户 drop user user_name
三、GUEST用户
一个特殊的数据库用户
四、权限管理
授权:grant [ select/insert/update/delete] on 表存储过程对象 to 用户
拒绝权限:deny 操作 on 对象 to 用户
撤回权限:revoke 操作 on对象 to 用户
五、角色
1、固定服务器角色
dbcreator:具有创建、修改、删除和还原数据库权限
sysadmin:具有服务器和数据库上执行任何操作的权限。
授权:sp_addsrvrolemember
删除授权:sp_dropsrvrolemember
2、数据库角色
db_datareader:具有查询数据库中所有用户数据的权限
db_datawriter:具有插入、删除、更改所有用户数据的权限
db_owner:具有全部操作的权限
授权:sp_addrolemember
删除:sp_droprolemember
第十章 数据库运行维护与优化
一、维护工作主要包括
1、数据库的转储与恢复:需定期恢复测试
2、数据库的安全性、完整性控制:制定行政规范
3、检测并改善数据库性能
4、数据库的重组与重构
重组:不修改原有设计的逻辑结构和物理结构
重构:部分修改数据库的模式和内模式
二、运行状态监控与分析
1、自动监控机制
2、手动监控机制
数据库架构体系的监控
数据库性能监控
三、数据库性能优化
1、外部调整:CPU资源等
2、模式调整与优化
a.增加派生性冗余列。如总价=单价*数量
b.增加冗余列
c.重新组表
d.分割表
e.新增汇总表
3、存储优化
a.物化视图
b.聚集
4.查询优化
a.合理使用索引
b.避免排序或简化排序
c.消除对大型表数据的顺序存取
d.避免复杂的正则表达式
e.使用临时表加速查询
f.用排序来取代非顺序磁盘存取
g.不充分的链接条件
h.存储过程
i.不随意使用游标
j.事务处理
第十一章 故障管理
一、四类故障
1.事物内部故障:大部分是非预期的,由系统自动完成
2.系统故障(软故障):所有正在运行的事务以非正常方式终结,需要重启系统
3.介质故障(硬故障):破坏性最大
4.计算机病毒故障:破坏方式以破坏数据文件为主
二、数据转储(备份)
1、静态转储:转储操作和事务是互斥的,保证转储前后的一致性
2、动态转储:允许转储操作和用户事务并打执行,但不能保证转储数据的一致性。
三、数据转储机制
1.完全转储
2.增量转储:只复制上次转储后发生变化的文件或数据块
3.差量转储:对最近一次完全转储以来发生变化的数据进行转储。
4.完全转储+增量转储:其中任何一次转储出现问题都会导致恢复的失败,同事回复时间较长。
5.完全转储+差量转储:操作简单,恢复时间短。但需要移动和转储更多数据。
四、日志文件
五、磁盘保护技术
1.RAID0:优点采用数据分块、并行传送方式,能够提高读写速度。缺点 出现介质故障时无法恢复。
2.RAID1:提高了读速度,加强了系统的可靠性。缺点:磁盘利用率低,冗余度为50%,同时写速度并未提高。
3.RAID5:磁盘空间利用率比RAID1高,存储成本相对较低。
六、数据库镜像分类
1.双机互备援模式
2.双机热备份模式
3.三种实现方式:高可用性、高保护、高性能
第十二章 备份与恢复数据库
一、造成数据丢失的原因
1.存储介质故障
2.用户误操作或操作错误
3.服务器故障
4.病毒侵害造成数据丢失或损坏
5。自然灾害造成数据丢失或损坏
二、恢复模式
1.简单恢复模式:只用于测试和开发库 或只读库,不备份事务日志
2.完整恢复模式:完整记录所有的事务,备份日志文件
3.大容量日志恢复模式:完整性恢复模式的附加模式
三、数据库备份
1.完整数据库备份(完全转储)
2.差异数据库备份(差异转储):备份最近一次为完整数据库备份之后的数据
四、文件备份
1.文件备份
2、差异文件备份
五、事务日志备份:只备份日志记录
1.纯日志备份:不包含大容量备份模式下执行的任何大容量更改的备份。
2.大容量操作日志备份:不允许对大容量操作日志备份进行试点恢复
3.结尾日志备份:在出现故障时进行,用于防止丢失数据
六、常用备份策略
1.完整数据库备份
2.完整数据库备份+日志备份
3.完整数据库备份+差异数据库备份+日志备份
七、实现备份
备份数据库与文件组
backup database data_name to 备份设备 【 with differential 差异备份】默认完全备份 disk| tape 指定磁盘文件或磁带设备
备份日志
backup log data_name to 备份设备 norecovery
实现还原
restore database data_name
第十三章 大规模数据库架构
一、分布式数据库
分布式数据库系统:物理上分散、逻辑上集中的数据库系统
分布式数据库:是分布式数据库系统中各场地上数据库的逻辑集合。
分布式数据库的12个目标
1.本地治理
2.非集中式管理
3.高可用性
4.位置独立性
5.数据分片独立性
6.数据复制独立性
7.分布式查询处理
8.分布式事务管理
9.硬件独立性
10.操作系统独立性
11。网络独立性
12.数据库管理系统独立性
数据分布策略:先数据分片,后数据分配
数据分片:水平分片、垂直分片、导出分片、混合分片
数据分配:集中式、分割时、全复制式、混合式
分布透明性
1.分片透明性:最高级别、完全透明
2.位置透明性:指数据分片的分配位置对用户是透明的
3.局部数据模型透明性
分布式数据库查询代价
由CPU代价和I/O代价来衡量,要考虑站点间传输数据的通信代价
导致数据传输量大的主要原因:数据间的连接操作和并操作
分布式事务管理:恢复控制和并发控制
恢复控制:基于二阶段的提交协议
并发控制:基于封锁协议
二、并行数据库
体系结构
1.共享内容结构:共享一个主存储器,实现简单、容易造成访问内存冲突
2.共享磁盘结构:共享磁盘,会产生通信代价
3.无共享结构:不共享任何资源。最好并行结构。缺点:通信代价和非本地磁盘访问代价很高。
4.层次结构:顶层无共享结构、底层共享内存或共享磁盘结构。
数据划分
1.轮转法:顺序扫面、平均分配、适合扫描整个关系。缺点:不适于点查询和范围查询。
2.散列划分:适合点查询。缺点:散列函数的选用。
3.范围划分:适合点查询和范围查询。但会造成数据分布不均匀。
三、云计算
第十四章 数据仓库与数据挖掘
一、数据仓库
是一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用来支持管理人员的决策。
体系结构:操作性数据、操作性数据存储、数据仓库、数据集市、个体层数据(临时数据)
四个级别:
1、早期细节级:老化以后的细节数据
2、当前细节级:经过集成后进入当前细节级
3、轻度综合级:对当前细节级进行轻度综合
4、高度综合级:对当前细节级进行高度综合
粒度:综合级 又称为 粒度
粒度越小 细节程度越高 数据量越大
元数据:描述数据的结构、内容、链、索引等内容
技术性元数据:描述关于数据仓库技术细节的数据
业务性元数据:从业务角度描述了数据仓库中的数据
ODS:面向主题的、集成的、可变的、数据是当前或结晶当前的
ODS 1:第一类秒级
ODS 2:第二类小时级
ODS 3:第三类天级
ODS 4:第四类根据数据来源方法和类型划分
数据仓库的设计过程:
概念模型设计、技术评估、环境准备工作、逻辑模型设计、物理模型设计、数据生成与应用实现、数据仓库运行与维护
数据仓库的更新维护:维护策略
实施维护:触发条件:数据源进行数据的更新操作(性能要求高,难以实现)
延时维护:触发条件:数据发生变化后首次进行查询操作(视图查询世家你相对较长)
快照维护:触发条件:时间(通常无法提供最新的数据,广泛使用)
二、OLAP
多维分析非基本操作
1、钻取与卷起
子主题
2、切片与切块
3、旋转
OLAP的实现方式
1.基于多维数据库的OLAP
2.基于关系数据库的OLAP
3.混合型的OLAP
三、数据挖掘
三阶段:数据准备、数据挖掘、结果解释评估
关联规则挖掘
1.支持度:两者都买,站总数据仓库的辈分比
2.置信度:两者都买,占其中买X的备份比(买了X中有多少人买了Y的百分比)
分类挖掘:构造方法:统计方法、机器学习方法、神经网络方法
聚类挖掘:使得每一组内的数据尽可能的我相似而不同组间的数据尽可能的不同。
包括:统计方法、机器学习方法、神经网络方法、面向数据库的方法。
计算机等级考试三级/四级数据库技术补充笔记
常见创建语句
CREATE DATABASE -----> 创建数据库
CREATE PARTITION FUNCTION -----> 创建分区表
CREATE UNQUE CLUSTERED | NONCLUSTERED -----> 创建索引
CREATE PROC ----->创建存储过程
CREATE FUNCTION -----> 创建标量|内联表值|多语句表值函数
CREATE TRIGGER -----> 创建触发器
事务的几种性质
一致性
完整性
可串行性:两段锁协议保证
遗忘
触发器通常用于保证业务规则和数据完整性
与触发器有关的两张宝建议使用大写
数据库设计各阶段包含的内容
逻辑设计阶段:数据库逻辑结构设计、数据库事务概要设计、应用程序概要设计
概念设计阶段:系统总计框架设计
物理设计阶段:数据库逻辑模式调整、文件组织与存取设计、数据分布设计、安全模式设计、确定系统配置、物理模式评估
数据库运行和维护阶段:日常维护、监控与分析、性能优化与调整、系统进化
数据库实现和部署阶段:创建数据库、数据装在、应用程序的编码和调试、数据库的试运行
数据库应用系统设计的四个层次
1.表示层
2.业务逻辑层
3.数据访问层
4.数据持久层:设计工作属于数据组织与存储等方面的物理设计内筒(包括索引设计),属于物理设计阶段
最后大题
一、正对数据库系统本身即网络传出过程中可能的一些调优方案:
1.把数据、日志、 索引放在不同的I/O设备上,增加读取速度,数据量越大提高IO越重要
2.纵向、横向分割表,减少表的尺寸
3.升级硬件,扩大服务器的内容,增加服务器CPU个数
4.重建索引,收缩数据和日志,设置自动收缩日志,对于大的数据库不要设置数据库自动增长,它会降低服务器的性能。
5.优化锁结构
二。SQL查询语句优化方案
1.对查询进行优化,应该尽量避免全表扫描,首先应考虑在where及order by涉及的列上建立索引
2.应尽量避免在where子句中使用!= 或 <> 操作符,否则将引擎档期使用索引而进行全表扫描
3.任何地方都不要使用select * from 进行全表扫描,用具体的字段列表代替,不要返回冗余字段
4.避免频繁创建和删除临时表,一件超系统表的消耗。
5.尽量避免使用游标,因为游标的效率较差,如果游标操作的数据超过1万行,name就应该考虑改写
6.尽量避免大事务操作,提高系统并发能力。
三。使用UNION对大量数据进行查询的优化方法
使用union all替代union进行合并操作,原因是union会自动压缩多个结果集众重复的数据(删除合并重复数据),而union all则是将所有的结果显示出来,不考虑重复也就减少了操作量。
四。磁盘阵列RAID的特点和选择
RAID0:采用数据分块,并行传输方式,能够提高读写速度,但是由于没有冗余备份,所有数据可靠性低(其中一个盘 介质出问题时无法恢复)
RAID1:增加了镜像(冗余数据),所以数据读速度提高(可以同时从原数据和冗余数据中读取),可靠性增加。硬盘利用率低(毕竟冗余数据占用50%)
RAID5:只比RAID0增加了一个奇偶校验信息
总的来说: RAID0单纯提高了性能但缺少数据可靠性。 RAID1提高了数据可靠性和读速度,蚕食CPU占用率高,磁盘利用率低。 RAID5则是一种存储性能数据安全和存储成本兼顾的方法。