导图社区 地理信息系统 第三章 空间数据表达
地理信息系统原理与应用 中 空间数据的表达
编辑于2020-04-27 15:59:28第三章 空间数据表达
3.1 空间实体及其描述
什么是地理信息系统
GIS是一种空间信息系统,是在计算机软硬件系统支持下,对地球表层的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统
GIS 连接了空间数据和属性数据(文本数据)
地理空间(地球表层)
地理空间实体的定义
自然界现象和社会经济事件中在一定表达尺度下不能再分割的单元。其大小可以大到一个城市、一个国家,小到一个控制点、一个钻孔
地理空间实体类型
点
点要素
实心点:结点 空心点:拐点(形状点)
实体点
用来表示一个实体,如控制点,电视塔,贵重要素等;表达特定空间位置和属性
注记点
用于定位注记
内点
用于负载多边形的属性,存在于多边形内
结点
表示线的终点和起点
角点
表示线段和弧段的内部点
线
线要素
实体位置
通常由一列有序坐标表示
实体长度
从起点到终点的总长
弯曲度
用于表示像道路拐弯时弯曲的程度
方向性
水流方向是从上游到下游,公路则有单向和双向之分
线状实体包括线段、边界、链、弧段、网络、单向线、多边线、网络链、完整链、弦环(封闭线)、弧环(封闭线)、定向链码
面
面实体也称为多边形,是对湖泊、岛屿、地块快、房屋等地理现象的描述。
空间特性
面积范围
周长
独立性或与其他的地物相邻,如中国及其周边国家
内岛或锯齿状外形
重叠性与非重叠性
面状实体类型
内部区域
简单多边形(仅有一个边界)
复杂多边形(几个边界)
像素
格网(像素阵列)
体
立体状实体用于描述三维空间中的现象与物体,它具有长度、宽度及高度等属性
空间特性
体积,如工程开掘和填充的土方量
每个二维平面的面积
平面周长
内岛或锯齿状外形(如矿体)
含有孤立块或相邻块
断面图与剖面图
纹理等
地理空间实体的维数
地理空间:包括二维、三维
地理空间实体维数
零维点、一维线、二维面、三维体
地理空间实体的描述
描述地理空间实体的五项基本内容
识别码
用于区别同类而又不同的实体
几何数据
位置或定位数据,可用坐标表示
属性数据
描述实体属性特征的数据,说明”是什么“,如类别、等级、数量、名称和状态等
关系数据
描述实体间空间关系的数据,如相邻、包含等
时间数据
描述实体的生命周期及其变化情况
实体空间类型剖分
点线面是对空间实体类型的 完整剖分
空间实体的时间特征
时间特征变现为:实体随着时间的变化,包括实体的生命周期、属性变化、事件描述等
GIS数据的度量
度量
商鞅为统一秦国度量衡于公元前344年制造的标准量器,用于计量长短和容积的标准
GIS数据的度量
对地理实体的鉴别、分类、命名,常用量表(定量化)表示
名义量表
对变量中的数据进行分类,并给予名称。用数字、字母、名称或任何记号将不同现象加以区分即可。即根据性质确定差别而不涉及定量表示的方法。如地理要素分类与编码
子主题
顺序量表(等级量表)
把数据排列成为次序,把事物按次序排列,没有相等单位、没有绝对零值
间隔量表
一种有相等单位,但没有绝对零值的量表。间隔量表没有绝对零值,只能做加减运算,不能做乘除运算,如温度。

比率量表(等比量表)
它具有绝对零值,可进行加减乘除四则运算
如人口数量、多边形面积、两地间距离等
空间现象分类描述举例


3.2 空间关系
空间关系概念
空间关系是数字环境下空间认知、空间分析、空间推理的前提和基础。
广义空间关系包括
由空间物体的几何特性(如空间物体的地理位置与形状)引起的空间关系,如:距离、方位、邻近、包含、连通性、相似性等
由空间对象的几何和非几何属性共同引起的空间关系,如空间分布现象中的统计相关、空间自相关、空间相互作用、空间依赖等。
三类主要空间关系
拓扑关系
连续空间观念、拓扑空间、拓扑几何学
相连、相邻、包含
度量关系
一般对应于欧式几何学,二维、三维空间
距离、方向
序关系
基于全序或偏序集合观念,如族谱等
前后、上下
二维空间实体的拓扑属性

空间拓扑关系
空间拓扑关系是指拓扑变换(例如平移、缩放、旋转)下的拓扑不变量。如空间目标的相邻和联通关系等。拓扑关系是空间数据质量控制最可靠的基础。二维空间中二元拓扑关系包括六大类(点、线、面的两两组合)


空间距离关系
空间距离反映空间物体之间几何位置上的接近程度

空间方向关系
方向关系表示了两个空间实体间的一种空间顺序

3.3 空间问题论述
为什么要讨论空间问题

空间关系

空间参考

生态分析

移动目标跟踪

变化分析

空间问题归纳
条件定位:根据一定的条件与规则确定物体的位置或者路径
路径提取
定位选取
资源分配、开销安排
间接推理:通过建立模型进行的空间决策和预测
项目选址
灾害预测与预报、环境分析
长度、体积、面积、坡度等量算
空间参考
特定的笛卡尔坐标或极坐标、最小尺寸的封闭矩形
地名或数字代码
地块、分区及其他外形规则或不规则的空间块
移动互联
实时、应急跟踪与服务(导航)
网络查询(兴趣点等)
基于实时观测数据的灾害预测与预报、环境分析
3.4 空间数据模型概述
数据模型与数学模型
数学模型
数学模型是针对参照某种事物系统的特征或数量依存关系,采用数学语言,概括地或近似地表述出地一种数学结构,这种数学结构是借助于数学符号刻画出来地某种系统地纯关系结构。数学模型包括数学中的各种概念,公式和理论。
数据模型
数据模型是数据特征的抽象。数据是描述事物的符号记录,模型是现实世界的抽象。数据模型从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表示与操作提供了一个抽象的框架。
空间数据模型的定义
数据模型的三个特征
是对现实世界的抽象和模拟
由那些与研究分析问题有关的部分或因素构成
表达这些有关的部分或因素及其相互关系
空间数据模型特征
是对现实世界地理空间的抽象和形式化描述
是关于GIS中空间数据组织的概念和方法,反映现实世界中地理空间实体及其相互关系,是描述GIS空间数据组织和进行空间数据库设计的理论基础
空间数据模型是地理信息系统的核心和框架结构
二维空间数据结构
GIS的二维静态空间数据模型
GIS二维空间数据抽样方法分类
二维空间数据模型
矢量(特征要素)
强调了个体现象,其假设空间是连续的,要素个体被嵌入连续空间
栅格(场)
将连续空间离散成许多格网,通过格网(位置)属性来表达那里怎么样
空间数据的四个抽象层次
现实世界
用户视图,对现实世界的不同抽象和描述
概念数据建模
在综合各用户视图的基础上,用统一的语言描述:空间实体的空间位置,专题属性和时间属性及其相互间关系
基于平面图的点线面模型(矢量)
基于连续面片的铺盖模型(栅格)
逻辑数据建模
表达数据实体及其间关系
面条模型
拓扑关系模型
对象关系数据建模
物理数据建模
物理数据组织 空间分块方法
GIS空间数据模型的分类
按维数分
二维空间数据结构
三维空间数据结构
思维时空数据结构
按连续或离散
要素(网络)模型
场模型
按抽象层次
概念数据模型
逻辑数据模型
物理数据模型
按实现技术
面对对象的数据模型
基于记录的数据模型
3.5 矢量数据模型
矢量数据模型概念
将地理空间实体抽象为点、线、面、体四种基本类型,采用精确坐标来表达具有精确定位和明显边界的地理要素
矢量数据模型的基本约定
2DGIS只包括点、线、面三类空间数据类型,在同一表达尺度下每个空间对象属于且仅属于一种空间类型
每个空间对象属于且仅属于一种属性(语义)类型,语义即“是什么”属性也具有剖分特征
每个点必须有一对定位坐标
每条边必须有一对始节点和尾节点
每条边仅属于一个线对象的一部分
每条边有且仅有一个左面域和一个右面域
一般边与边之间仅在端点处相交,否则在交点处打断
边与边相交特例

点要素
实体点
注记点
内点
结点
角点
线实体
实体长度
弯曲度
方向性
包括:线段、边界、链、弧段、网络等
面实体
空间特性
面积范围
周长
独立性或与其他的地物相邻
内岛或锯齿状外形
重叠性与非重叠性
类型
面条模型

拓扑关系模型

网络模型


3.6 栅格数据模型
基本概念
栅格数据模型是将连续区域按照一定的规则进行二维划分,形成覆盖该区域的多个小单元结构,每个小单元有各自的大小、位置和明确的属性。是用单元格实现对连续区域的离散化表示。

实体在栅格数据模型中的表示
点实体
表示为一个栅格单元或像元
线实体
表示为一定方向上连接成串的相邻像元的集合
面实体
表示为聚集在一起的相邻像元的集合
每个栅格单元的值表示该对象的类型、等级等属性特征
栅格数据模型需要的参数
栅格原点:栅格系统的起始坐标应当和国家基本比例尺地形图公里网的交点一致,或和已有的栅格系统数据一致
栅格形状:通常是正方形,有时也采用矩形、三角形、正六边形等。

栅格单元尺寸大小/分辨率
栅格单元大小决定了栅格数据的分辨率
栅格单元尺寸越小,其分辨率越高,数据量也越大
栅格的属性
栅格单元的取值
中心点法:每个栅格单元的值以网格中心点对应的面域属性值来确定
面积占优法:每个栅格单元的值以在该网格单元中占据最大面积的属性值来确定
长度占优法:每个栅格单元的值以在该网格中线的大部分长度所对应的面域的属性值来确定
重要性法:每个栅格单元的值以栅格单元内最重要的地物类型来确定
栅格数据的组织方法
以层的方式来组织文件

物体的空间位置用其在笛卡尔平面网格中的行号和列号坐标表示
物体的属性用像元的取值表示,每个像元在一个网格中只能取值一次
同一像元要表示多重属性的事物就要用多个笛卡尔平面网格,称为层
三种组织方式
基于栅格(像元)方式
子主题
简介明了,便于数据扩充和修改,但进行属性查询和面域边界提取时速度较慢
基于层方式
子主题
便于进行属性查询,但每个像元的坐标均要重复存储,浪费了存储空间
基于面域方式

便于面域边界提取,但在不同层像元的坐标还是多次存储
栅格数据编码方法
直接栅格编码
将栅格数据看作一个数据矩阵,逐行或逐列逐个代码记录,也可以奇数行从左到右,偶数行从右到左。每个像元用一个字节(即编码值)表示
优点:编码简单,信息无压缩、无丢失
缺点:数据量大
记录栅格数据的文件常称为栅格文件,常在文件头记录栅格数据的长和宽,即行数和列数
压缩编码方法
链码
游程长度编码


有相同属性值的临近像元被合并在一起称为一个游程
基本思想:压缩相邻重复内容
特点:属性的变化越少,游程数越少,压缩比例越大。适宜于面积较大的专题要素、遥感图像的分类结构,不适于类型连续变化或类型分散的分类图
优点:压缩率高;易于检索、叠加、合并操作
缺点:只顾及单行单列,没有考虑周围其他方向代码值是否相同;压缩受到一定限制
块状编码
四叉树编码
基本思想:将一幅栅格地图或图像等分为四部分,逐块检查其格网属性值(灰度)如果某个子区所有格网值都具有相同的值。则这个子区就不再继续分割
采用四叉树编码时。为了保证四叉树的分解能不断进行下去,要求图像必须为2^n*2^n的栅格阵列,n+1为四叉树的最大高度或最大层数
对于非标准尺寸的图像首先需要通过增加背景的方法将其扩充为2^n*2^n的栅格阵列
分类
常规四叉树:记录叶结点和中间结点,每个结点用四个叶结点指针、一个父节点指针、一个结点的属性
主要应用于数据索引和图幅索引
线性四叉树:用地址码表示叶结点的位置,隐含了叶结点的位置和深度信息
编码形式
四进制MORTON编码
缺点:码的存储开销大,由于大多数语言不支持四进制变量,需要用十进制长整型表示,是一种存储浪费。;运算效率不高
十进制MORTON编码
先将十进制的行列号转换成二进制数,进行”位“运算操作,即行号和列号的二进制数两两交叉。再转换为十进制数

子主题
优点

缺点

编码方法
自上而下分割
自下而上合并
栅格数据压缩编码
用尽可能少的数据量记录尽可能多的信息,其类型又有信息无损编码和信息有损编码之分
信息无损编码是指编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息
信息有损编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复。
在地理信息系统中多采用信息无损编码,而对原始遥感影像进行压缩编码时,有时也用有损压缩编码方法
3.7 矢量、栅格模型比较与转换