导图社区 数据库
这是一篇关于数据库的思维导图,主要内容包括:5.结构化查询语句SQL,4.数据库系统,6.大数据,7.分布式数据库-noSQL,8.大数据挖掘,9.大数据思维,3.数据库管理系统(DBMS),2.数据库DB,1.信息与数据。
编辑于2024-08-31 16:42:21数据库
1.信息与数据
信息
信息就是新的,有用的事实和知识,具有时效性、有用性和真实性,是客观世界的反映。
信息有四个基本特征
信息的内容是关于客观事物或思想方面的知识
信息是有用的
信息能够在空间和时间上被传递
信息需要一定的形式表示
信息的表示形式与载体是数据
数据
特征
数据有“型”和“值”之分
数据的型是指数据结构(数据的内部构成和对外联系)
数据的值是指数据的具体取值
数据受数据类型和取值范围的约束
数据有定性表示和定量表示之分
数据具有载体和多种表现形式
数据库管理信息
避免冗余
数据独立性好
共享性好
设置数据访问权限
2.数据库DB
数据库是按照数据结构来组织存储和管理数据的仓库,数据库是存储在一起的相关数据的集合,数据库里面存储的是一张一张的二维表,数据库中的表是有关联的
数据库中数据的特点
结构化
独立性
完整性
共享性
安全性
冗余量小
并发控制
并发是指多个任务的同时执行,任务与任务之间没有联系
E-R图(E-R模型)
Entity-Relationship Model1976年,P.P.S.Chen提出E-R模型,使用E-R图来描述信息
观点
世界是由一组称作实体的基本对象和这些对象之间的联系构成的
实体-联系模型(E-R模型)常见术语
实体
实体的建模
实体用属性来描述
属性:实体所具有的某一方面特性
关键字/码:实体中能够唯一区分开每一实例的属性或属性组合
实体与表的对应
一个个实体是表中的一行称作元组
一类实体对应表
联系
指不同实体中的实例之间所可能发生的关系,也就是说一位用户可购买多种商品,某种商品可以卖给多个用户
种类
一对多(1:1)
一对多(1:m)
多对多(m:n)
3.数据库管理系统(DBMS)
DBMS是管理数据库的系统软件,它实现数据库系统的各种功能,是数据库系统的核心。
常用数据库管理软件
管理内容
数据库定义:定义数据库中数据的格式
数据库操纵:向数据库中增/删/改数据及查询数据
数据库控制:控制数据的使用,保证数据的正确
数据库维护:转储/恢复/重组/性能监测/分析/...
DDL定义,DML操作都是由数据模型觉定的
数据模型
有什么样的数据模型就有什么样的数据库,数据模型决定数据库的性质
严格定义的概念的集合
构成
数据结构
数据操作
完整性约束
常用的数据模型
关系模型(主流数据库) 层次模型 网状模型
关系模型
关系模型的数据结构与数据操作
数据结构
关系
数据操作
关系操作或关系代数
并
关系A关系B具有相同的数据格式
差
积
广义的笛卡尔积
交
特有
选择
投影
连接运算
。。。。
完整性约束
实体完整性、参照完整性、用户定义的完整性
关系模型与关系数据库
关系数据库是基于关系模型的数据库
关系模型是对表格的抽象,是对二维表格及其操作的定义
关系的通俗解释
关系的性质
列是同质的(Hocogeneous),即每一列中的分量是同一类型数据,来自问一个域
不同的列可出自同一个域,每一列称为属性,要给予不同的属性名
列的顺序可以任意交换,行的顺序也可以任意交换
任意两个元组不能完全相问
每一分量必须是不可分的数据项
4.数据库系统
数据库系统(Data Base System,简称DBS)是指计算机系统引入数据库后的系统构成,是一个具有管理数据库功能的计算机软硬件综合系统
具体地说,它主要包括计算机硬件、操作系统、数据库(DB)、数据库管理系统(DBMS)和建立在该数据库之上的相关软件、数据库管理员和用户等组成部分。
应用系统:
决定整个系统的外部特征由某种语言编写而成
9.大数据思维
大数据的“三个不是,三个而是”
不是随机样本,而是全体数据;
不是精确性,而是混杂性;
数据量的显著增大也必然会让我们付出一些代价:一些不准确的数据会混入数据库,结果也可能不准确
不是因果关系,而是相关关系。
大数据时代最大的转变就是,放弃对因果关系的渴求而取而代之关注相关关系。也就是说只要知道“是什么”而不需要知道“为什么”
全集与不精确
不求因果只看关系
8.大数据挖掘
7.分布式数据库-noSQL
促成noSQL的原因
大数据包括结构化、半结构化和非结构化数据。非结构化数据越来越成为数据的主要部分
大数据和云计算的关系
大数据的系统需求
高性能
海量存储
可扩展性和海量存储
需要拥有快速横向扩展能力,能提供7*24小时不间断服务
什么是noSQL
NoSQL是Not 0nly SQL而不是NotSQL;它不一定遵循传统数据库的一些基本要求,比如SQL标准、ACID属性、表结构等
相比传统数据库,叫它分布式数据管理系统更贴切数据存储被简化更灵活,重点被放在了分布式数据管理上。
NoSQL数据库主要应用于web2.0的大规模系统,具有模式灵活、最终一致性、面向海量数据、分布式、开源、水平可扩展、配置简单、非关系型等特点
优势
易扩展
数据模型灵活
无需事先为要存储的数据建立字段随时可以存储自定义的数据格式
高可用
大数据量,高性能
NoSQL的CAP原理
分布式数据库系统的CAP原理三要素
一致性(Consistency)
可用性(Availability)
分区容忍性(Partition tolerance)
NoSQL的CAP原理实现
NoSQL的数据模型及分类
6.大数据
IBM提出大数据的5V特点
Volume(大量)
Velocity(高速)
Variety(多样)
Value(低价值密度)
Veracity(真实性)
价值体现
发展趋势
5.结构化查询语句SQL
概述
SQL是结构化查询语言(Structured Query Language)的简称。
1987年6月,国际标准化组织将SQL定为国际标准。
SQL是一种一体化语言,包含了数据定义语言、数据操纵语言、数据控制语言、数据查询语言。
SQL既可以单独使用,又可以嵌入到程序设计语言中使用。
SQL简单查询的创建
显示表中所有数据
显示表中指定字段
显示表中指定记录
按照指定顺序显示数据
使用distinct关键字
使用top关键字
模糊查询
认识两个通配符
%:表示该位置可以被任何字符代替
_表示该位置只能被一个字符代替
模糊查询语法
条件查询
嵌套查询
它允许一个查询语句内部嵌套另一个查询语句。嵌套查询可以出现在SELECT、FROM或HAVING子句中,作为条件表达式的一部分。它们主要用于返回在外部查询中使用的数据,或者用于定义要在外部查询中使用的条件。
分组查询
分组查询是SQL中非常重要的一个功能,它允许你将查询结果按照一个或多个列进行分组,并对每个分组执行聚合函数(如SUM、AVG、COUNT、MAX、MIN等)以计算汇总信息