导图社区 空间分析与建模
这是一篇关于空间分析与建模的思维导图,主要内容包括:第五章 地理加权回归分析技术,第一章 绪论,题型,第七章 探索性空间分析,第六章 地统计分析,第四章 空间点模式分析,第三章 地理相关性分析,第二章 空间数据分析的基础理论。
编辑于2025-09-12 15:11:12这是一篇关于空间分析与建模的思维导图,主要内容包括:第五章 地理加权回归分析技术,第一章 绪论,题型,第七章 探索性空间分析,第六章 地统计分析,第四章 空间点模式分析,第三章 地理相关性分析,第二章 空间数据分析的基础理论。
遥感科学与技术专业课,高光谱遥感是指用很窄而连续的光谱通道对地物持续遥感成像的技术(多波段目连续→成像光谱遥感)。
中国矿业大学《计算机地图制图》课程期末复习,是以计算机硬件设备为基础,在相应软件系统的支持下,以数字格式对地图制图要素与现象数据进行采集、处理与管理,按照地图制图的规范进行符号化、图版制作与输出,并提供地图自动分析的全过程
社区模板帮助中心,点此进入>>
这是一篇关于空间分析与建模的思维导图,主要内容包括:第五章 地理加权回归分析技术,第一章 绪论,题型,第七章 探索性空间分析,第六章 地统计分析,第四章 空间点模式分析,第三章 地理相关性分析,第二章 空间数据分析的基础理论。
遥感科学与技术专业课,高光谱遥感是指用很窄而连续的光谱通道对地物持续遥感成像的技术(多波段目连续→成像光谱遥感)。
中国矿业大学《计算机地图制图》课程期末复习,是以计算机硬件设备为基础,在相应软件系统的支持下,以数字格式对地图制图要素与现象数据进行采集、处理与管理,按照地图制图的规范进行符号化、图版制作与输出,并提供地图自动分析的全过程
空间分析与建模
题型
选择、名词解释、问答题、综合题
第一章 绪论
背景知识
目前科学研究进入第四范式:数据密集型的科学发现
大数据的应用案例
轨迹大数据
空间分析的概念及特点
空间分析
基于地理对象的位置和形态特征的空间数据分析技术,其目的是提取和传输空间信息
空间数据分析
侧重数据驱动的空间分析,eg:探索性空间数据分析、地统计分析等
基于地理对象的空间位置特征、属性特征和时态特征的数据分析技术
第二章 空间数据分析的基础理论
地理学定律
第一定律:空间相关性
任何事物都是空间相关的,距离近的十五空间相关性(相近即相似)
距离:非欧式距离,而是地理空间中的相对匀质的地理单元之间的距离。
空间邻近度:正比于公共边界长,反比于中心距(中心点之间的距离)。
时空邻近度:地理空间任意两匀质区域(含点)之间的时空邻近度,对给定的“流”,正比于二者之间的总流量,反比于从一端到达另一端的平均时间。
第二定律:空间异质性
地理现象具有不可控的空间变化(地理加权回归)
第三定律:空间相似性(有争议)
地理环境越相似,地理目标特征越接近(两个点/区域的空间结构越相似,则它们的值就越相似)
空间关系理论
空间关系的类型及描述
顺序空间关系
两点之间的基本方向关系
定性描述模型
锥形模型
基本思想
在从某个空间目标出发指向另一个目标的锥形区域中确定两个空间目标间的空间方向关系
方法
从参考目标的质心出发作两条相互垂直的直线,将所在的平面划分为4个无限锥形区域,每个锥形顶点的角平分线指向方向为一个主方向(东南西北)
方向判断
源目标位于参考目标的锥形区域方向
最小约束矩形模型(MBR)
基本思想
找出空间目标在X和Y轴上的投影最大和最小值→最小约束矩形(MBR)
两个空间目标间的方向关系的确定转变为相应的两个目标MBR的方向关系的判断
方向关系矩阵模型
基本思想
将平面空间划分为9个区域,每个区域为一个方向片,每个方向片对应一个主方向,参考目标所在的方向片称为同方向
度量空间关系
空间指标
长度
周长
面积
距离度量描述
平面中两点距离:欧氏距离、广义距离、契比雪夫距离等
球面距离
大地测量距离:球面上两点间的大圆距离
大圆:地球表面二点与球心构成的平面构成的大圆圈。
球面曼哈顿距离:维度差+经度差
具有行业特色的距离定义:
统计学中的斜交距离、马氏距离等;
旅游业中:旅游时间距离等。
拓扑空间关系
定义
拓扑变换下的拓扑不变量
拓扑变换
变换后图形的点与原来图形的点之间存在一一对应关系,邻近点还是邻近点
拓扑属性和非拓扑属性的区分
非拓扑属性:顺序关系和度量关系
描述模型
4元组模型
将简单空间实体看作是边界点和内部点构成的集合
两个简单空间实体点集的边界与边界的交集、边界与内部的交集、内部与边界的交集、内部与内部的交集构成的4元组(2X2矩阵)
理论上有16种组合
9元组模型
在4元组的基础上,在空间描述框架中引入空间实体的“补(外部)”的概念
边界、内部和外部三个部分的集合
理论上可区分512 种关系
V9I模型
时空空间关系
地理实体之间的空间关系往往随着时间而变化,时间关系交织在一起就形成了多种时空关系
时空拓扑关系
当点、线、面目标之间的空间相邻、空间包含等关系随时间发生变化时,往往与目标间的时间拓扑关系交织在一起
时空关系模型
时间区间关系和空间区域关系的正交组合
空间认知理论
地理空间认知
认知科学(认知心理学)与地理科学(空间分析)的学科,研究人类如何逐步理解地理空间,进行地理分析和决策
研究内容
地理知觉
将地理事物从地理空间中区分出来,获取其位置并对其进行识别
格式塔心理学
人类能分辨哪些信息属于一个整体进而把这些信息组织成一个有明确意义的目标
地理表象
表示地理形象思维所产生的各种“象“
地理概念化
是地理世界已知地理实体、实体属性和实体间关系的知识库,依据概念化知识记忆和理解地理世界 (把具有共同特征的事物归为一类,而把不同特征的事物放在不同类中)
常用方法
经典集合论
三元组(O,A,R)
O表示(形式)对象(Formal Objects)的集合
A表示(形式)属性(Formal Attributes)的集合
R是对象O和属性A之间的关系
基于原型
关于某一类事物的典型特征模式,物体特征与原型认知范畴越接近,就越有可能被划归到某一原型范畴中
类型:基于核心成员-“原型”而构建,类型不具有关键属性,事物类型的归属通过其与原型的相似程度来判定
在原型分类下,类型集合的边界是模糊的,为模糊集
地理知识类型
地标认识
路线知识
测量知识
人工智能+遥感/GIS的应用举例
空间推理理论(了解)
空间不确定性理论
不确定性
定义:指被测量对象知识缺乏的程度
(不确定性和误差的区别)误差指统计意义下的偏差或错误,主要包括系统误差、随机误差和粗差; ”不确定性”是一个比“误差”更广义、更抽象的概念。
表现形式(能描述不同特征的表现特点)
随机性
重复观察,在观察之前知道所有可能的结果,但不知道到底哪一种结果会出现(掷骰子)
模糊性
“一粒”“一堆”,它们的区别是渐变的,不是突变的,两者之间并不存在明确的界限。
空间分析的不确定性
空间数据的获取和处理产生不确定性(仪器设备和处理技术)
空间数据的不确定性影响决策结果的质量
空间数据的不确定性直接影响GIS产品的质量
空间分析方法的不确定性
网络分析及其不确定性
空间统计分析及其不确定性
叠置分析及其不确定性
缓冲区分析及其不确定性
不确定性及其分布的可视化
第三章 地理相关性分析
相关的定义与原理
定义
两个或两个以上变数间相互关系是否密切
相关关系(非确定的关系)
函数关系(确定的关系)
相关程度的度量方法
简单直线相关程度的度量
相关程度
研究两个地理要素之间的相互关系是否密切
相关方向
正相关:y值随x的增加而变大或随x的减少而变小
负相关:y值随x的增加而变小或随x的减少而增大
相关系数
检验
原因
相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度
通过在给定的置信水平下,查相关系数检验的临界值表来实现
如何读表
顺序(等级)相关系数
秩相关系数检验
(多要素)相关系数矩阵 (对角线数值为1的对称矩阵)
多要素相关程度测度
偏相关系数
基本概念
偏相关
在多要素所构成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数(保持不变),即暂不考虑其它要素的影响。
偏相关系数
用以度量偏相关程度的统计量
可利用单相关系数(零级相关系数)来计算
假设有三个要素x1,x2,x3,其两两间单相关系数矩阵为
计算
一级偏相关系数
下标点后面的数字,代表在计算偏相关系数时,保持不变量(如r12·3 即表示x3保持不变)
二级偏相关系数 (四个要素)
性质
检验(了解)
t-检验
复相关系数
反映几个要素与某一个要素之间的复相关程度
2个变量
3个变量
k个变量
性质
检验(了解)
F-检验
相关系数指数
Person指数
Sperman指数
Kendall等级相关系数
空间统计分析
以区域化变量理论为基础,以变异函数为主要工具,研究具有地理空间信息特性的事物或现象的空间相互作用及变化规律的学科 (研究区中所有的值是非独立的,相互之间存在相关性)
区域化:变量呈空间分布
变异函数
空间自相关性
通过相关分析可以检测两种现象(统计量)的变化是否存在相关性,若所分析的统计量为不同观察对象的同一属性变量,则称之为自相关。
空间自相关 (第一定律)
定义
同一个变量在不同空间位置上的相关性
反映的是一个区域单元上的某种地理现象或某一属性值与邻近区域单元上同一现象或属性值的相关程度
仅与两点间的距离有关
各向同性
考虑方向的影响,可能在不同方向上属性值与距离的关系不同
各向异性
空间权重矩阵
确定规则
简单的二进制邻接矩阵
基于距离的二进制空间权重矩阵
基本原理与方法
全局空间自相关
Moran指数
空间邻接或空间邻近的区域单元属性值的相似程度
计算公式
Z检验
当Z值为正且显著时,表明存在正的空间自相关,相似的观测值(高值或低值)趋于空间集聚; 当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布 当Z为零时,观测值呈独立随机分布
Geary系数
局部空间自相关分析 (重点:三个方法)
空间关联的局部指标 (LISA)
每个区域单元的LISA:描述该区域单元周围显著的相值区域单元之间空间集聚程度的指标
所有区域单元LISA的总和与全局的空间关联指标成比例
LISA
局部Moran指数
标准化统计量
局部Geary指数
G统计量
检验值
显著的正值表示在该区域单元周围高观测值的区域单元趋于空间集聚;显著的负值表示低观测值的区域单元趋于空间集聚
G统计量能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式
Moran散点图 (怎么解读)
(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性
z:被检验变量的标准化值
Wz:z的空间滞后因子
四个象限
分别对应于区域单元与其邻居之间四种类型的局部空间关联形式
第一象限代表了高观测值的区域单元被同是高值的区域所包围的空间关联形式
第二象限代表了低观测值的区域单元被高值的区域所包围的空间关联形式
第三象限代表了低观测值的区域单元被同是低值的区域所包围的空间关联形式
第四象限代表了高观测值的区域单元被低值的区域所包围的空间关联形式
不同空间权重矩阵对空间自相关的影响
影响权重有哪些(从公式上看): 距离(空间距离、时间距离)
正态分布误差对全局自相关指数影响的模拟分析
第四章 空间点模式分析
三种基本类型
聚集分布
随机分布
均匀分布
二元空间点模式问题
一种现象的分布模式是否对另一种现象的分布模式产生影响?
影响程度多大?如何量化这种影响?
点模式分析方法
以聚集性为基础的基于密度的方法
计数法、核函数方法
以分散性为基础的基于距离(测度最近邻点)的方法
最邻近指数、G-函数、F-函数、K-函数方法等
基于密度的方法
样方分析(QA)
一般过程 (怎么做)
研究区划分成规则的正方形网格区域
统计落入每个网格中的数量
统计出包含不同数量点的网格数量的频率分布
将观测得到的频率分布或理论上的随机分布作比较,从而判断点模式的类型
影响因素
样方的形状
采样的形式
样方的尺寸
最优样方尺寸公式
显著性检验(了解)
根据频率分布比较的K-S检验
根据方差均值比的t检验
核密度估计(KDE)
一般过程
每一个数据点处设置一个核函数,利用这个核函数来表示该点领域内的分布
对整个区域内的所有需要计算密度的点,其数值可以看作是其领域内的已知点处的和函数对该点的贡献之和
贡献率取决于该点到领域内已知点的距离s,以及核函数的形状和取值范围(带宽)
重要参数
核函数
带宽
控制核函数宽度的参数,它决定了估计的平滑程度
小→尖锐 大→平缓(掩盖密度的结构)
基于距离的方法
最邻近距离法
一般过程
分别计算观测模式和已知模式(CRS)下最邻近点对之间的平均距离得到最邻近点距离,然后比较观测模式和已知模式(CRS)最邻近点距离之间的相似性(计算最邻近指数R)
观测模式的最邻近距离>CRS的最邻近距离(R>1):观测模式趋于均匀
观测模式的最邻近距离=CRS的最邻近距离(R=1):观测模式趋于随机
观测模式的最邻近距离<CRS的最邻近距离(R<1):观测模式趋于聚集
极端聚集状态:R=0,所有事件发生在研究区的同一位置上
极端均匀状态:R=2.144,均质区域上邻近的3个点构成等边三角形,即空间被正六边形划分,点位于正六边形中心(克里斯特勒中心地分布模式)
完全随机模式(CRS)
研究区域的任何地方具有同等几率的接受点(区域是匀质的)
一个点区位的选择不会影响另一个点区位的选择(点是相互独立的)
G函数和F函数
G函数
计算过程
计算每个点到最近邻点的距离dmin
将所有计算得到的最邻近点距离从小到大进行排序,得到一个距离序列
计算最邻近距离的变程R和组距D,R=max(dmin)-max(dmin)
根据组距上限值,累积计数点的数量,并计算累积频率数G(d)
画出G(d)-d的曲线图
G(d)-d曲线图
a:聚集分布,先迅速增长
b:随机分布
c:均匀分布,先缓慢增长再迅速增长
F函数
第五章 地理加权回归分析技术
基于地理学第二定律:空间异质性
地理加权回归分析
回归分析
研究一个变量(因变量)如何受到一个或多个变量(自变量)影响的方法
回归与相关的区别
相关
通过计算相关系数(如皮尔逊相关系数、斯皮尔曼等级相关系数等)来量化变量之间的关系。
确定变量之间是否存在关系(不存在自变量和因变量的划分),但不涉及预测或因果推断。
回归
通过拟合一个数学模型(如线性回归、多项式回归、逻辑回归等)来描述变量之间的关系。
可以用来预测因变量的值,同时还可以评估自变量对因变量的影响大小和方向。
作用
在每个观测点处拟合一个局部回归方程,从而揭示变量间的局部关系
地理加权回归分析模型
基于距离的权重计算
距离越近,权重越高
距离越远,权重越低
参数
权重
核函数
带宽
固定型带宽
定义一个固定的距离阈值b,将固定值b用于所有点的权重计算
距离不变,点的数量改变
适合空间数据均匀分布
可变型带宽
定义一个正整数N,针对任意求解位置点,计算数据点到该点的距离,取距其第N近的距离值作为当前的带宽值b
距离改变,点的数量不变
适合空间数据不均匀分布(稀疏、密集)
最优带宽
使偏差和方差达到均衡”最优”
案例
房地产市场
第六章 地统计分析
地理第一定律
地统计分析概述
定义
以区域化变量理论为基础,以变异函数为主要工具,研究那些分布于空间上既有随机性又有结构性的自然或社会现象的科学
研究内容
区域化变量理论
变异函数模型
克里金估计方法
特点
样本点的空间相关性
(与传统统计学最大的不同)一次性样本采集
样本区域中每一个空间位置多为一次采样数据
区域化变量理论
揭示区域化变量的空间结构和统计性质。
区域与区域化
区域
被赋予地学含义的空间
区域化
一个专题变量分布于空间,呈现一定的结构性和随机性
eg:城市化
区域化变量(区域化随机变量)
Z(x)为一随机变量(随机性)
用于描述在空间位置x处的专题变量取值
点x1、x2的随机变量Z(x1)、Z(x2)通常是不独立的(地理学第一定律)(结构性)
区域化现象:区域化变量描述的现象
空间变异函数
区域化变量的空间结构描述
定义
γ(h) = 1/2*Var(Z(x+h)-Z(x))
(方差的一半)
平稳性(内蕴)假设
定义
为了满足总体规律推断中多个样本(大样本)的数据要求,假设多个空间位置采样数据(每个位置一次采样数据)来代替单个位置上的多次采样数据
机理
相近相似规律普适性
空间结构的稳定性
地学现象空间结构
分类(了解)
严格平稳性假设
随机变量的联合分布的空间位移不变性
F(Z(x1),Z(x2),…Z(xn))=F(Z(x1+h),Z(x2+h),…Z(xn+h))
弱平稳性假设
二阶平稳性假设
满足条件
1)研究范围内,区域化变量Z(x)的期望存在且为数:E(Z(x))=m
2)研究范围内,区域化变量Z(x)的协方差函数存在且为空间滞后h的函数,与空间位置x无关:Cov[Z(x),Z(x+h)]=C(h)
协方差和方差
协方差和期望的关系
内蕴性假设
满足条件
1)在研究范围内,区域化变量Z(x)增量的期望为0:E(Z(x+h)-Z(x))=0
2)研究范围内,区域化变量Z(x)增量的方差存在且为空间滞后h的函数,与空间位置x无关:Var[Z(x+h)-Z(x)]=2γ(h)
变异函数曲线
参数
克里金估计
作用
时间域:服务于不同目的估计分别称为滤波(除去噪音)、平滑(找出趋势)和预测(计算未来值)
空间域:分为内插(计算研究区域内的未知值)和外推(计算研究区域外的未知值,又称为预测)
分类
点估值
块段估值
通过赋予块段平均值给块段中心点来转化为点估值
或者把块段离散为若干点的集合,从而转化为点估值
普通克里金估计
泛克里金估计
第七章 探索性空间分析
一般统计分析
数据的频数分析
频数
将变量xi(i=1,2,…,n)按大小顺序排列,并按一定的间距分组,变量在各组出现或发生的次数。
频率
各组频数与总频数之比
频率直方图
以纵轴表示频率,横轴表示分组,表示事件发生的概率和分布状况
数据的集中程度
平均数
算术平均值
加权算术平均值
调和/倒数平均值
各个数据的倒数的算术平均数的倒数
简单调和平均值
加权调和平均值
几何平均值
中位数
众数
数据之间的差异程度较大
数据的离散程度
离差
一组数据集中的各数据值与其平均数之差
一个数据集的离差和恒等于0
平均离差
离差平方和
方差
离差平方和除以变量个数
极差
一组数据中最大值与最小值之差
分布分析
正态分布
偏度
样本分布的偏斜方向和程度
偏度的取值范围为(-∞,+∞)
当偏度<0时,概率分布图左偏。
当偏度=0时,表示数据相对均匀的分布在平均值两侧,不一定是绝对的对称分布。
当偏度>0时,概率分布图右偏。
峰度
样本分布曲线的尖峰程度
峰度的取值范围为[1,+∞)
峰度值越大,概率分布图越高尖,峰度值越小,越矮胖。
样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布
幂律分布(长尾/重尾)
分布函数f(x)与变量x之间是幂函数关系
长尾效应
过去人们只关注重要的人或事,即正态分布曲线的“头部”,而忽略曲线“尾部”的大部分。但在网络时代,关注成本大大降低,尾部产生的总体效益甚至会超过头部。
中心距
一阶
均值
中位数、众数
二阶
方差
三阶
偏度
四阶
峰度
探索性数据分析 EDA
定义
对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。
特点
对数据总体不作假设
假设检验也经常被排除在外
基本方法
计算EDA方法
图形EDA方法
直方图
茎叶图
最大特点:保留了原始资料的信息
箱线图(盒须图)