导图社区 汤国安《地理信息系统教程》第五章 空间数据组织与管理
参考汤国安《地理信息系统教程》第五章 空间数据组织与管理,做成思维导图,帮助同学学习地理信息系统教程这一门课程
编辑于2022-12-31 13:54:28 江苏省空间数据组织与管理
空间数据库概述
空间数据库基础
数据库概念
常用数据模型

层次模型
网状模型
非关系模型
关系模型
面向对象模型
空间数据库
内涵
地理信息系统数据库
某一区域内关于一定地理要素特征的数据集合
是地理信息系统在计算机存储介质存储的与应用相关的 地理数据的总和
一般是以一系列特定结构的文件形式组织在存储介质之上的
主要是为GIS提供空间数据的存储和管理方法
空间数据的存储和管理通常有两种方式
空间数据文件存储管理
空间数据库存储管理
类型上分为
栅格数据库
航空遥感影像数据
DEM数据
矢量数据库
各种空间实体数据
重要性及表现
在地理信息系统中占有及其重要的地位,是地理信息系统发挥功能和作用的关键
主要表现
用户在决策过程中,通过访问空间数据库获得空间数据
在决策过程完成后再将决策结果储存到空间数据库中
空间数据库的布局和存储能力对地理信息系统功能的实现和工作的效率影响极大
特点(与一般数据库相比)
数据量特别大
数据结构复杂
数据关系多样
数据应用广泛
空间数据库设计
概述
概念
设计概述
先确定需要的专题
再指定各专题图层的内容和表现形式
在继承传统数据库设计的基础上,还必须遵循特有的设计范式
设计内容
选择数据模型与划分地理实体
确定数据实体属性与空间结构
实现丰富的地理实体行为
属性关系及完整性约束
设计步骤
汤
确定业务需求与目标信息产品
根据信息需求,确定主要数据主题
指定比例范围及每个数据专题在每个比例下的空间表示
将各种表示形式分解为一个或多个地理数据集合
为描述性的属性定义表格型数据库结构和行为
定义数据集的空间行为、空间关系和完整性规则
构建可用的原型,查看并优化设计及测试原型设计
记录地理数据库设计
黄
需求分析
调查用户需求
需求数据的收集与分析
编制用户需求说明书
结构设计
概念设计
对需求阶段所收集的信息进行分析整理
确定地理实体、属性及它们之间的联系
将各用户的局部视图合成一个全局视图
形成独立于计算机反映用户需求的概念模型
主要采用的是语义数据模型和面向对象数据模型
逻辑设计
任务
把信息世界中的概念模型 利用数据库管理系统所提供的工具 映射为数据库管理系统所支持的数据模型,并用数据描述语言表达出来
关系数据模型设计理论的三个主要部分
数据依赖
范式
模式设计的方法
物理设计
指数据库存储结构和存储路径的设计,即将数据库的逻辑模型在实际的物理存储设备上加以实现
常常包括某些操作约束,如响应时间、存储要求等
空间数据库的建立与维护
空间数据库的建立
建立空间数据库结构
数据装入
调试运行
空间数据库的维护
空间数据库的重组织
空间数据库的重构造
空间数据库的完整性、安全性控制
空间数据特征与组织
空间数据的基本特征
空间特征
空间对象有空间坐标
空间对象隐含空间分布特征
非结构化特征
空间数据不能满足定长(结构化)要求
空间关系特征
拓扑结构表达多种空间关系
多尺度与多态性
不同比例尺具有不同的尺度和精度
同一地物在不同情况下也会有形态差异
分类编码特征
按照国家标准、行业标准、地区标准进行应用
一种地物类型对应一个属性数据文件
海量数据特征
GIS数据量庞大,远大于一般通用数据库
需要在二维空间上划分块或图幅
在垂直方向上划分层来进行组织
空间数据组织
空间数据的分层组织
概念
优点
根据用户实际需要,灵活叠加,构成数据层组或子集,进行分析和制图表达
既适合于矢量数据,也适合于栅格数据,
也是当今大多数GIS空间数据库所采用的主要数据组织形式
缺点
层与层之间的数据必须经过层叠置处理才能关联在一起
在叠置处理中,对栅格数据常需要大量存储空间来完成操作,而矢量数据则需大量的计算处理
同一图层各要素的空间关系较为简单并易于处理,不同图层上地理要素之间的空间关系则较难处理
空间数据的分块组织
概念
优点
提高存储效率
是各级基础地理数据组织的主要方式
缺点
割裂了跨多个分块的地理要素,给空间查询、分析操作造成障碍
空间数据的无缝组织
概念
涉及大范围、海量空间数据的数据组织时,采用连续、无缝的数据组织形式,以满足用户任意和透明地访问和操作数据的要求
实现的三种途径
几何无缝
视觉上不存在缝隙
只是形式上的,实际上仍然时图幅或分块形式
逻辑无缝
在几何无缝的基础之上,对分幅或分块边界断裂的要素进行逻辑接边
在逻辑上建立跨越多个图幅或分块的各个地理要素的唯一标识、链接关系或索引结构,甚至可使其共享相同属性
要素本身在物理上仍保持分幅或分块存储的一种空间数据的组织形式
物理无缝
在逻辑无缝数据组织的基础之上
通过物理接边,使其合为一个整体
多尺度空间的数据组织
概念
对现实世界的数字化表达中,不存在比例尺的概念
但从观察、理解及制图的角度来看,当涉及大范围区域时,往往需要从宏观到微观
以不同的层次细节来刻画地理要素,这就要求必须建立多尺度或多比例尺空间数据库
目的
从空间数据可视化的角度考虑,提供变焦处理的能力
即随着观察范围的减少,GIS应能提供类别更多、数据更大和细节更详细的信息
可根据不同的应用和专业分析的需要,提供满足不同精度要求的空间量算和空间分析能力
构建途径
按比例尺的各个层级,事先构建多个比例尺的空间数据,此为 静态方式
建立一个叫较大比例尺的空间数据库,其他比例尺的空间数据采用自动综合算法由该库动态地派生,此为 动态方式
事先建立少量等级且比例尺跨度较大的空间数据库作为基本骨架,对相邻比例尺的数据则采用自动综合予以生成,此为混合方式
优点
可根据用户的数据请求,由系统自动调度相应地比例尺数据,实现从粗略到精细的数据查询和分析
缺点
重复存储,数据冗余
同一地理要素在各比例尺数据库的表达存在不一致或缺乏联系
属性数据组织
概述
方式
与工作层对应的组织方式
与地物类对应的组织方式
混合方式
空间数据管理
矢量数据管理
概述
空间位置数据和数量数据是分开的
同时顾及空间位置数据和属性数据
属性数据适合用关系数据库管理
分类
文件——关系数据库混合管理
传统GIS软件
内涵
图像数据和属性数据独立组织、管理和检索
文件系统管几何图像
商用关系型数据库管理属性数据
通过目标标识与内部链接码连接
需用同时启动两个系统,需要在两个系统之间切换,使用起来不方便
只要开发GIS和ODBC的接口,就可以将属性数据与任何一个支持ODBC协议的关系数据库管理系统连接
不论是通过高级语言还是odbc与关系型数据库连接,GIS用户都是在同一个界面处理图形和属性数据,称为混合方式
不足之处

全关系管理
概念
图形数据与属性数据都采用现有的关系型数据库存储
使用关于数据库标准连接机制来进行空间数据与属性数据的连接
处理方式及优缺点
按照关系数据库组织数据的基本准则,对面长的几何数据进行关系范式分解,分解成定长记录的数据表进行存储。缺点是需要进行大量的连接操作,非常费时并影响效率
将图形数据的变长,部分处理成binary 二进制block块字段。省去了大量关系连接操作,但是二进制快的读写效率要比定长的属性字段慢得多,特别是涉及对象的嵌套速度更慢
对象关系数据库管理
内涵
由于直接采用通用的关系数据库管理系统的效率不高,而非结构化的空间数据有十分重要,所以许多数据库管理系统的软件商在关系数据库管理系统中进行扩展,使知能直接存储和管理非结构化的空间数据
优缺点
优点
解决了空间数据的变长记录变长的管理,效率比二进制块的管理高的多
利用关系数据库管理系统中的大对象字段可以分块存储影像和dem数据
缺点
没有解决对象的嵌套问题
空间数据结构也不能由用户任意定义,使用受一定限制
对于多尺度dem数据,影像数据的空间索引,无缝拼接与漫游,多数据源集成等技术还没有一个完整的解决方案
栅格数据管理
概述
影响数据和DEM数据的组织与管理差别不大,以下一影响数据管理为例
栅格影像不仅包含属性信息,还包含隐藏的空间位置信息(即格网的行列信息),隐含他们之间的关联关系
分类
基于文件的影像数据库管理
目前大部分GIS软件和遥感图像软件采用文件方式管理
由于遥感影像数据库不仅包括图像数据本身,而且还包含大量的图像元数据信息(如图像类型、摄影日期、摄影比例尺等)遥感图像数据本身还具有多数据源、多时相等特点,另外,数据的安全性、并发控制和数据共享等都使其无法应付
文件——数据库影像管理
影像数据仍按照文件方式组织管理
在关系数据库中,每个文件都有唯一的标志号ID对应影像信息,如文件名称、存储路径等
这种方式管理影像数据不是真正的数据库管理方式,你将数据并没有放入数据库中,数据库管理的只是其索引,由于影像数据索引的存在是影像数据的检索效率得到提高
基于关系数据库管理
内涵
基于扩展关系数据库的影像,数据库管理是将影像数据存储在二进制的变长字段当中,然后应用程序通过数据访问,接口来访问数据库当中的影像数据,同时影像数据的元数据信息存放在关系数据库的表当中,二者可以进行一个无缝的管理
管理影像数据的特点
所有数据集中存储,数据安全,易于共享
较方便管理多数据源和多时态的数据
支持事务处理和并发控制,有利于多用户的访问与共享
影像数据和元数据集成到一起,能方便地进行交互式查询
对Client/Server的分布式应用支持较好,网络性能和数据传输速度都有极大提高
影像数据访问只能通过数据库驱动接口访问,有利于数据的一致性和完整性控制,数据不会被随意移动、修改和删除
支持异构的网络模式,即应用程序和后台数据库服务器可以在不同操作系统平台下运行
时空大数据管理
来源
基础测绘数据与专题数据
遥感影像数据
导航定位数据
互联网及物联网数据
管理
既要考虑多元异构大数据的接入组织提取,又要考虑分析过程数据分析结果数据的协调和组织
就时空大数据的存储和共享而言,目前通过技术成熟的分布式存储方式对数据进行存储管理。在存储模型和处理机制方面,有充分考虑了数据存储的灵活性和可扩展性
空间数据库引擎(SDE)
概念
是一种GIS产品或模块
主要是指通过 解决存储在关系数据库中的空间数据与应用程序之间的数据接口,从而将空间图形数据存放到大型关系数据库进行管理
ArcSDE
利用空间索引机制来提高查询速度
利用长事务和版本机制来实现多用户同时操作同一类型数据
利用特殊的表结构来实现空间数据和属性数据的无缝集成等
方式
一种 以ESRI与数据库开发商联合开发的空间引擎SDE为代表,可称为“中间件”方式的空间数据库引擎
另一种空间数据库引擎 由数据库厂商自己对数据库本身做出拓展,使其支持空间数据库管理如Oracle 的Spatial 模块
作用
在用户和异种数据库之间提供了一个开放接口,它是一种处于应用程序和数据库路管理系统之间的中间件技术
使用不同厂商GIS的客户可以通过空间数据库引擎将自身数据提交给大型关系型DBMS,由DBMS统一管理
同样,客户也可以通过空间数据库引擎从关系型DBMS中获取其他类型GIS数据,并转化为客户可以使用的方式
空间数据索引
概述
概念
依据空间对象的位置和形状或空间对象之间的某种空间关系按一定顺序排列的一种数据结构,其中包括空间对象的概要信息
空间索引通过筛选,将无关的空间对象排除,从而提高空间操作的速度和效率
空间索引性能的优劣直接影响空间数据库和gis的整体性能,所以它是很关键的一个技术
重要性
作为辅助性的空间数据结构,空间索引介于空间操作算法和空间对象之间
通过它的筛选,大量与特定空间操作无关的空间对象得以被排除,从而提高空间数据操作的速度和效率
空间索引的性能优劣可以直接影响空间数据库和地理信息系统的整体性能,它是空间数据库和地理信息系统的一项关键技术
常见的空间索引一般是自顶向下、逐级划分空间的各种数据结构
算法
对象范围索引
方法
在记录空间实体的坐标时,记录包围每个空间实体的外接矩形的最大最小坐标
这样在检索空间实体时,根据空间实体的最大最小范围
预先排除那些没有落入检索窗口内的空间实体
仅对那些外接矩形落在检索窗口的空间实体作进一步判断
最后只检索真正符合范围要求的空间实体
评价
由于该索引只是对数据文件增加了最大最小范围,所以对象复杂范围,仍需要花时间检索
格网索引
方法
将研究区用横竖线条划分为大小相等和不等的格网,记录每一个格网包含的空间实体
当用户进行空间查询时
首先计算出用户查询对象所在格网
然后再在该格网中快速查询所选空间实体
这样一来就大大加速了空间索引的查询速度
评价
为了提高查询速度,将每个格网进行编码,建立编码与空间实体的关系,该表格称为格网索引文件
按格网法对空间数据进行索引时,划分的格网不能太多,否则索引表本身太大而不利于数据的索引和检索
四叉树索引
方法
根据空间对象覆盖的范围,进行四叉树分割,使每个子块中包含单个实体
然后根据包含每个实体的子块层数或子块大小,建立相应的索引
在四叉树索引中,大区域空间实体更靠近树的根部,小实体位于叶端,以不同分辨率来描述不同实体的可检索性
评价
四叉树中的线性四叉树和层次四叉树都可以用来建立空间索引
线性四叉树采用十进制Morton码或Peano码来表示四叉树的大小和层数
结构灵活、效率更高,是许多商用gis系统空间数据库首选的索引方法
层次四叉树需要记录不同层次节点间的指针,建立索引和维护都比较困难
R 树和 R+树空间索引
R树索引
是一种动态索引,它的查询可与插入删除同时进行,而且不需要定期对树结构进行重新组织
具体来说,是利用空间实体的外接矩形进行空间索引
而且不仅利用单个实体的外接矩形,还将空间位置相近的外接矩形重新组织为一个更大的虚拟矩形
在进行空间数据索引时,首先判断哪些矩形落入空间查询窗口内,再进一步判别哪些实体是被检索的内容,这样可以提高数据检索的速度
R+树索引
构造目的
在构造R树时,虚拟矩形之间尽量不要互相重叠,而且一个空间实体通常仅被一个同级虚拟矩形所包围。但由于空间实体的复杂性,外接矩形常常重叠,虚拟矩形难免重叠
内容
是一种改进,允许虚拟矩形重叠,并分割下层矩形,允许一个空间实体被多个虚拟矩形包围
通过对多个虚拟矩形同等程度的检索,以达到检索重叠区域空间实体的目的
cell 树(补充)
构造目的
前两者在插入删除和空间搜索效率两方面难以兼顾
内容
划分
在划分时不再采用矩形作为划分单位
采用凸多边形作为划分的基本单位
具体划分方法与BSP树有类似之处,子空间不再相互覆盖
特点
磁盘访问次数比前两者少,访问次数是影响空间索引性能的关键指标
所以CELL树是比较优秀的空间索引方法
查询语言(SQL)
概念
是用于关系数据库管理系统的常见结构化查询语言,具有直观、通用的特点
不仅仅用于查询,也是一个通用的、综合的、功能极强又简洁的关系数据库语言
特点
综合统一,集数据定义、操作、控制功能于一体,能够很好地满足数据操作要求
高度非结构化,SQL进行数据操作时,只需提出“做什么”,操作由系统自动完成
面向集合的操作方式
语言简洁、易学易用等
概括
功能极强,设计巧妙,语言简单,核心功能只需9个动词
接近英语口语,因此容易学习、容易使用
局限性
只提供简单的数据类型
后来OGIS又对其进行扩展,
把二维地理空间ADT(抽象数据类型)整合到SQL之中,并且包括了指定拓扑的操作和空间分析操作
在OGIS标准中,所指定的操作分为三类
用于所有几何类型的基本操作
用于空间对象拓扑关系的操作测试
用于空间分析的一般操作