导图社区 地理空间数据模型
地理空间数据模型,汇总了矢量数据模型、栅格数据结构、属性数据、GIS的空间数据模型概述、地理空间数据的组织方式、模拟地图与数字化空间数据的知识。
编辑于2023-08-29 15:00:09 陕西地理空间数据模型
3.4矢量数据模型
定义
把地理空间要素的位置信息抽象成几何元素的位置坐标
点
折线
多边形或面
点线面组成三角网络——起伏的地形
点线组成拓扑网络——道路网
分类
是否显式表达了地理空间要素之间的空间位置关系
简单矢量数据
只记录了地理空间的坐标位置,没有表达各个空间要素之间的空间位置关系(非拓扑数据)
分类
点、线、面中的一种
点
零维,位置性质
只记录其坐标位置
线
一维,有位置,长度特性
记录一串坐标及其空间位置,与面区别在于:面要素中的一串坐标中第一个和最后一个是完全相同的,即代表同一个点。
面
二维,位置面积周长性质
点、线、面各自的组合
线要素由连接一串坐标点的直线段组成
面要素是由一串坐标围成的环来表示的,但是环不能自相交。
典型代表
ESRI的shapefile格式的数据
至少包含三个文件
主文件(*.shp)
坐标数据
固定长度文件头
100字节的说明信息
文件长度、Shape类型、整个Shape数据的空间范围(构成空间数据元数据)
字节顺序
大端字节
高位字节放在内存的低地址端
低位字节放在内存的高地址端
小端字节
低位字节放在内存的低地址端
高位字节放在内存的高地址端
可变长度坐标数据记录
索引文件(*.shx)
字节偏移量
组成
文件头
与主文件文件头一致
实体信息
以记录为基本单位
偏移量
记录段长度
dBaseIII属性表文件(*.dbf)
主文件对应的属性记录(标准的DBF文件)
组成
头文件
实体信息
*.prj
以文本文件形式保存了空间数据的地理坐标系与投影坐标系的名称及参数信息。
拓扑矢量数据
空间数据除去记录了地理空间要素的位置坐标信息以外,还要进一步记录表达地理空间要素之间的空间关系的信息
典型类型
TIGER/LINE文件
Coverage数据
连通性
通过弧-节点拓扑来定义
弧度由两个端点定义
指示弧段起始位置的起始节点
相连弧段通过搜索列表公共节点编号来确定
指示弧段终止位置的终止节点
面定义
指由一条或多条边界弧段表示一个面要素
多边形-弧段拓扑
邻接性
每条弧段都有方向,且作为两个面的公共边界。
左侧多边形
右侧多边形
弧段起着承上启下的作用
向上是组成多边形
向下是联系所有的坐标点
属于地理关系数据模型
空间坐标数据存储于一系列的数据文件中(称为Arc)
属性数据另外存储于关系数据库内(称为Info)
采用标识码(ID)进行逻辑连接
Geodatabae
基于对象的空间数据模型
复杂矢量数据
结合点、线、面等多种要素,还表达了点线面之间的空间位置关系
类型
不规则三角网(TIN)
本质
将地理空间分割为不重叠的相连三角形的矢量拓扑数据,是用来表达起伏表面的数据模型。
既可以存储和显示地形数据,也可以表现其他连续分布的现象。
组成
大量三角形平面
顶点(具有x.y,z坐标值的已知采样数据点)
TIN最基本的结构单元
离散的测量点
折线上的点
连接这些高程点的常用办法
Delaunay三角测量法
边
通常是通过连接没个顶点与其较近的顶点形成的,每条边有两个顶点,但每个顶点可以连接多条边
表达了由顶点、边、三角形等组成的拓扑信息
TIN中每个三角形在空间里都可以形成一个三角平面,平面具有相同的梯度(地形坡度),一般就是用这个三角平面来描述TIN局部表面的空间形态。三角形三个顶点的x,y,z坐标值可用于插值计算三角面上任何一点的z数值,并计出坡度、坡向、表面积和表面积长度等数据。
TIN拓扑信息
保留每个三角形的三个顶点编码以及与可能的三个邻接三角形的编码
记录边的性质
硬隔断线
软隔断线
网络Network
表达现实中呈现网络结构的地理要素
道路网络
河流网络
公共设施网络(如电网、供水管网)
抽象成顶点和边组成的拓扑结构
包含节点阻抗和边的阻抗
3.5栅格数据结构
优点
结构简单
二维数组
多种表现形式
矢量栅格化转换形成的矢量数据对应的离散型栅格数据形式
遥感或航测的数字图像-数字正射影像图DOM/DOQ
通过扫描形成的地形图的彩色数字图像-数字栅格图(DRG)
表达数字地形的连续型栅格数据即数字高程模型(DEM)
名称定义
与矢量对应的栅格数据
单元称为栅格单元
遥感数字图像中单元称为像素
DEM中单元称为网格
分类
离散型栅格数据
从矢量数据模型直接转换过来形成的栅格数据
原先的一个矢量数据点转变成一个栅格单元格的位置表示,其属性值通常是一个整型数表示的某种属性代码。原先的一条矢量线由一串有序的相互连接的单元格表示,各个单元格的属性值相同。
连续型栅格数据
单元内部存储的是浮点型数值
优缺点
优点:结构简单且容易处理
缺点:随着栅格数据空间分辨率的提高,数据存储量快速增长
大范围连续型栅格数据
采用空间分块的方式来组织和存储
金字塔形式的多层、多分辨率的栅格数据
栅格单元的数值是海拔即高程时——数字地形数据——数字高程模型(DEM)
地形的坡度、坡向等信息——数字地形模型(DTM)
再把地表上的所有其他地物(如房屋、树木等)的高度一起加到地形之上形成的数据称为数字地表模型(DSM)
使用LiDAR对地标扫描获得的第一次回波就可以形成数字地表模型,其中包含了所有地表面上的物体的高度信息。
数字图像(DRG、DOM)
通过地图扫描制作的彩色图像——DRG数字栅格图
16色,每个像素(栅格单元)用4位二进制位
存储遥感影像——DOM数字正射影像
经过纠正,生成正射影像图(地形的起伏和相机造成的地物移位已经被消除掉)
GeoTIFF格式
记录了影像像元及其在地理空间坐标系中的位置信息。
实现栅格数据在计算机内部的存储方式
矩阵结构
最直接的存储结构——按照二维数组的方式存储
坐标原点设定在左上角
元数据
原点的空间坐标
每个栅格单元的大小
数值的类型(浮点型还是整型)
空值的数值
存储遥感影像
BIL波段按行交叉格式存储
BIP波段按像元交叉格式存储
BSQ按波段顺序格式存储
游程编码结构
矩阵编码数据的压缩存储形式
按行来组织,使用(属性值+游程)二元组来表达相邻相同属性值栅格单元在一行中所占据的区域
游程——行程
指栅格数据的一行之中,位置相邻且具有相同属性数值的栅格的个数。
记录“行索引”信息,协助快速找到某一栅格行的第一个游程编码在文件中的偏移位置。
四叉树结构
整个空间区域作为四叉树的根节点,将空间区域按照四个象限进行递归分割n次,每次分割成“2^n*2^n个子象限,每个子象限都作为上一次分割形成的节点的子节点,对某一子象限的分割过程直到子象限中的属性数值都相同为止,该子象限就不再分割,从而形成四叉树的叶子结点。即属性值都相同的子象限,不论大小,均作为最后的叶子结点存储。
两种相反的算法
自上而下
自下而上
莫顿码Morton/Peano健
二维空间的莫顿码可以形成线性四叉树的顺序
分类
常规四叉树
每个节点存储6个量
4个子节点指针
一个父节点指针
一个节点属性值
自下而上方法建立,对栅格按莫顿码顺序进行检测
记录叶节点+中间节点
简便灵活
线性四叉树
每个节点只存储3个量
莫顿码
深度(或节点大小)
节点值
原理
不需要记录中间节点、空值节点、也不使用父子节点之间的指针,仅记录非空值叶节点,并用莫顿码表示叶节点的位置。
优点
只存储3个值,比常规四叉树节省存储空间
由于记录节点地址,既能直接找到其在四叉树中的走向路径,又可以换算出它在整个栅格区域内的行列位置
压缩和解压缩比较方便,各部分的分辨率可不同,既可精确地表示图形结构,又可减少存贮量,易于进行大部分图形操作和运算。
3.6属性数据
性质与地理空间要素的位置无关——非定位数据
采用关系数据库的形式
关系型数据库通常把数据组织成一张张关联的表
横着的一行叫做一个记录,一个记录对应一个地理空间要素
每一行记录都是由若干数据项构成的,每一项叫做一个字段。字段可以根据需要设置不同的数据类型。
这一个或几个字段的组合可以唯一地标识某一个地理空间对象,这个标识就叫做键或关键字。
关键字的好处:把不同的属性表格通过关键字联系起来使用。
索引字段
标识码用ID来表示
属性索引(一维索引)
平衡二叉树
B-树
哈希表
空间索引(二维/三维索引)
适用于空间查询,给定一个空间位置,查询在这个空间位置上的空间数据库或空间数据文件中存有哪些地理空间要素。
分类
R-树索引
最小包围矩形(MBR)——在二维平面里包围一个或多个几何对象的矩形框
对一个二维空间里的地理空间要素建立R树索引的时候,就是生成一个包含不同层次MBR的平衡树。所有的叶节点是具体每个地理空间要素的MBR及其相关存储地址。而上层的MBR节点是空间相邻的地理空间要素的并集,包含了下层所有要素的MBR。
格网索引
将区域划分成大小相等的方格,并给每个方格一个顺序编码,顺序编码可以按照行列顺序来生成,作为空间索引字段的数值
其次,在索引对照表中记录下与每个方格空间相交的地理要素的存储地址。如果一个方格和多个要素相交,就需要记录多个要素的地址。
线性四叉树索引
将区域分割成若干层,每层将上一层的区域分成四个相等的子区域,就像四个象限。
当对空间地理要素计算索引的时候,就从上到下逐层判断该要素完全包含在哪一层的哪一个子区域中
进而用该子区域的四叉树编码作为索引编码,来记录该要素的存储地址,这样就形成了一个四叉树的空间划分
为了便于排序各个不同层的子区域,可以将每个子区域按Morton码进行线性四叉树编码,建立起以莫顿码为索引编码的索引对照表。
3.3GIS的空间数据模型概述
空间数据模型最终表达的是空间数据在计算机中存储的状态
两大类
矢量数据模型(抽象)——空间坐标和属性信息的整合方式不同
地理关系数据模型
空间数据模型
拓扑数据模型
Coverage数据
TIGER模型
非拓扑数据模型
TAB数据
Shapefile数据
属性数据模型
关系数据模型(数据库表文件)
基于对象的数据模型
将空间坐标数据和属性数据统一放在一起储存
存储形式
数据库
Geodatabase数据库(ESRI)
微软、Oracle、PostgreSQL
栅格数据模型(分解)
定义
把地理空间要素离散成占据空间的整齐划一排列的面积单位
为每一个面积单元分配一个数来表示这个面积单元里想要表达的空间要素的性质
三种主要形式
矩阵形式
游程编码形式
四叉树形式
3.2地理空间数据的组织方式
空间分区
把大的空间数据按照某种地理区域进行分割,将分割过的比较小的数据分别进行存储
地形图系列
行政区划
属性分层
一层表达一种属性
一层现状空间数据表达河流
一层面状数据表达土壤类型
一层点状空间数据表达商业网点分布
时间分段
空间数据和属性数据可能会随时间而变化
空间要素的位置
空间要素的几何形状
属性数据
GIS中给变化的空间和属性加上时间印来按时间分段记录
3.1模拟地图与数字化空间数据
模拟地图
点状符号
山峰、城镇等呈点状分布的地理要素
线状符号
河流、道路等呈线状分布的地理要素
面状符号
湖泊、行政区划等呈面状分布的地理要素
数字地图
把模拟地图也转换成用计算机来进行数字化的存储和表达,即用数字化空间数据来表达地理要素
空间坐标
点状地理要素
一对地理坐标或平面坐标
线状和面状
一串坐标
地理空间数据(数字化空间数据)
空间坐标数据
属性数据