导图社区 地理大数据
这是一篇关于地理大数据的思维导图,主要内容包括:什么是地理大数据,安全与隐私,典型地理数据,可视化,地理大数据分析技术,相关技术,大数据综述。
编辑于2024-12-24 17:44:32地理大数据
什么是地理大数据
大数据与地理时空数据的融合,以地球为对象、基于统一时空基准,活动于时空中与位置直接或间接相关联的大数据
大数据综述
大数据时代与发展
大数据时代
第三次信息化浪潮
信息科技提供技术支撑
1.存储设备容量增加—容量增大,价格降低,数据与存储设备相互促进
2.CPU处理能力提升
3.网络带宽增加
数据产生方式变革
运营式系统
数据库降低数据管理的复杂度
数据随着运营活动产生和记录,被动产生
用户原创内容—web2.0特征
互联网出现,促进数据传播,无需借助物理存储介质
移动设备加速内容产生
主动产生
感知式系统—物联网(IOT)
设备:传感器、摄像头、RFID
人类社会数据量第三次大的飞跃导致大数据产生
发展历程
萌芽--数据挖掘、数据库技术、数据仓库、专家系统、知识管理系统
成熟--web2.0,非结构化数据,大数据技术突破,并行计算和分布式系统两大核心
大规模应用--各行各业,数据驱动决策
大数据概念
定义:巨量数据集合,无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合
Web发展
web1.0:单向只读互联网时代
1991-2004,被动浏览
web2.0:可读写互联网
2004年至今
博客、社交媒体平台
用户自主生成内容,与网站、网友交互协作
网站分析用户行为,个性化呈现内容
web3.0:开放、隐私、共建
特点
数据量大——volume
2010年全球进入ZB时代,2020年有35ZB
指数级增长
数据类型多——variety
结构化、半结构化、非结构化
传统:关系型数据库
Web2.0等应用数据:NoSQL数据库
科学研究数据、企业应用数据(应用日志、交易记录)、web1.0数据(文本,图像、视频)、web2.0数据(查询日志、点击流)
消费者大数据、金融大数据、医疗大数据、城市大数据
价值密度低——value
长视频几秒钟有效
处理速度快——velocity
区别与传统数据的最显著特征
影响
对科学研究:
研究范式变化
实验:最初,实验解决问题
理论:实验受限、理论解决问题
计算:1946第一台计算机ENIAC
数据:物联网与云计算出现
计算:先提出可能理论,再收集数据,最后计算验证
数据:先有大量已知数据,然后通过计算得到未知的理论
对待数据的思维方式
样本-总体:全面认识,发现细节
精确-容错:宏观层面更好的知识
因果-相关
自然-智能:提升机器智能化水平
社会发展:决策方式、国家治理能力、信息技术与各行业融合、新技术新应用
就业市场:大数据人才需求增大
人才培养:计算机人才、统计学、业务人才
大数据应用举例
相关技术
云计算
概念
定义:通过网络,以服务的方式为用户提供廉价的IT资源
特点:超大规模计算、虚拟化、高可靠性和安全性、通用性、动态扩展性、按需服务、降低成本
与传统比较比较
云计算初期零成本,瞬时可获得;后期免维护,使用成本低;IT资源供应量“予求予取”
传统自建机房初期成本高,周期长;后期自己维护,使用成本高;IT资源供应量有限
服务模式与类型
服务模式
基础设施层:基础设施即服务,infrastructure as a service
概念:出租硬件
自主性、灵活性、安全性高
不易扩展,成本高
平台层:平台即服务,platform as a service
概念:出租操作系统和围绕特定应用的必须服务
节省部分资源、较容易资源扩展
自主性灵活性一般
应用层:软件即服务,software as a service
概念:
集中系统部署软件,允许出租应用程序,计时收费
在网络上任意一个远程服务器上的应用都是SAAS
节省资源与运维成本
安全性一般
类型:私有云、混合云、公有云
数据中心
基础设备:不间断电源、环境控制设备、网络防护墙、服务器
建设环境
1.地质结构稳定地方
2.气候凉爽
3.电力资源丰富--能耗大
代表厂商
谷歌的GFS和MapReduce为代表的大规模分布式并行计算技术
亚马逊的虚拟机和对象存储为代表的“按需租用”
应用--共享、整合、创新
政务云:城市管理、信息资源 与政务资源共享
教育云:整合优质教育资源
企业云:低廉成本
医疗云:推动共享
产业
产业链:制造硬件设备、运营、IAAS/PAAS/SAAP
物联网
概念
the Internet of things,物物相连的互联网
智慧地球:感应器嵌入公路、建筑等各种物体中,普遍连接,物联网与互联网整合
层次架构
应用层(智慧农业)、处理层(业务支撑平台)、网络层(互联网、电信网)、感知层(传感器)
关键技术
识别与感知技术、网络与通信技术、数据挖掘与融合技术
应用
智慧交通、医疗、家居、农业、工业
产业
信息采集—数据传输—数据处理
核心感应器提供商(RFID)—网络提供商—软件与系统解决方案提供商、运营与服务提供商
人工智能
概念
定义:研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术和应用的学科
学科:机器人、语言识别、图像识别、自然语言处理、专家系统
核心:重新组织已有的知识结构使之不断改善自身性能
关键技术
机器学习(核心)
概念:研究怎样模拟和实现人类的学习行为,获取新的知识或技能
大数据:基于数据的机器学习,从观测数据出发寻找规律,进行预测
过程:算法、经验、性能
基于数据,利用算法构建模型,进行评估;通过就用模型测试;否则重新来,直到满意
应用:语音识别、个性化推荐、模式识别、机器翻译
知识图谱
概念:可视化技术描述知识资源及其载体,挖缺、分析、构建、绘制、显示知识及相互关系
应用:公共安全反欺诈,搜索引擎
自然语言处理(NLP)
概念:研究实现人与计算机之间用自然语言进行有效通信的理论与方法
应用:机器翻译、印刷语言识别、
人机交互-研究系统与用户之间的交互关系
计算机视觉
概念:用摄影机或电脑代替人眼对目标进行识别、跟踪和测量的机器视觉
五大类:
计算机成像学
图像理解
三维视觉
视频编解码
动态视觉
应用:人脸识别、图像检索、检测
VR/AR
生物特征识别
应用
智能制造、智能家居、智能交通、金融、安防、医疗、物流
产业
智能信息及数据
智能基础设施建设
芯片、传感器、分布式计算框架
智能技术服务
智能产品
关系
大数据与云计算、物联网关系
1.物联网是大数据重要来源,大数据技术为物联网数据分析提供技术支撑
2.云计算为大数据提供了技术基础,大数据为云计算提供用武之地
3.云计算为物联网提供海量数据存储,物联网为云计算技术提供了广阔的应用空间
4.大数据继承自云计算
大数据与人工智能
联系
1.大数据技术为人工智能提供强大的存储和计算能力
2.人工智能需要数据来建立智能,特别是机器学习
区别
人工智能是一种计算形式,大数据是传统计算,只是寻找结果
目标与实现目标的手段不同
结合GIS——geoai
研究和开发机器的空间智能
应用
数据分析与预测
分析历史数据,预测地震发生的可能性与影响范围,预测高危地区
自动化与智能化--自动处理复杂地理空间任务
灾害管理,实时分析影像,快速识别受灾区域提供应急方案
提升决策支持
优化城市交通系统
变化检测
违章建筑
深度学习+空间分析
挑战与局限
地理空间数据的质量与可用性
数据安全与隐私
地理大数据分析技术
技术层次
数据采集与预处理
数据采集
概念:数据分析的入口,通过各种技术手段将外部数据源产生的数据采集并加以利用
比较
数据源:传统数据来源单一、数据量小——大数据来源广范,数据量大
数据类型:传统结构单一——大数据数据类型丰富,结构、半结构、非结构
数据存储:传统使用关系数据库与并行数据库——大数据使用分布式数据库,分布式文件系统
要点:全面、多维、高效
数据源
传感器
互联网数据
借助网络爬虫
爬虫将非结构化数据从网页中抽取出来,存储为统一的本地数据文件,以结构化的方式存储
企业业务数据
日志文件
概念:数据源系统产生,记录数据源执行的各种操作活动
数据清洗
地位:纠正数据文件中可识别错误的最后一道程序
需要清洗的数据类型
残缺数据
重复数据
错误数据
内容
检查数据一致性
变量的合理取值范围
相互关系,是否矛盾
是否符合要求,逻辑合理
处理无效值和缺失值
处理方法
估算
用样本均值、中位数、众数替代
分析变量间关系或逻辑推论
整例删除(删除整个有错误值的样本)
关键变量缺失、含有错误样本占比小
变量删除
某一变量的缺失值较多,且不重要
成对删除
用特殊码代表无效值,保留全部变量与样本
数据存储与管理
传统
文件系统
组成:接口、操纵和管理对象的软件集合、对象及属性
举例:word、PPT、文本文件、音频文件、视频文件由文件系统管理
关系数据库(主流)
使用关系模型
关系表的集合
产品:Oracle,SQL Server,MySQL.DB2
数据仓库
概念:面向主题的、集成的、相对稳定的、反映历史变化的数据集合
区别于数据库
数据库面向事务,数据仓库面向主题
数据库存储在线交易数据,数据仓库存储历史数据
并行数据库
概念
无共享体系结构中进行数据操作的数据库系统
关系数据库模型,利用关系表的水平划分、SQL查询的分区技术支持SQL语言并行查询
高性能和高可用性
缺点
弹性差
容错性差
转移成本高
集群处理差
大数据时代
分布式文件系统(Distributed file system)
概念:利用网络实现文件在多台主机进行分布式存储的文件系统
产品
谷歌GFS
Hadoop的HDFS(GFS的开源实现).,提供在廉价服务器集群中进行大规模分布式文件存储的能力
NewSQL
对各种新的可扩展、高性能数据库的简称、泛指
海量数据存储,保持传统数据库支持的ACID,SQL
支持关系数据模型
SQL为主要接口
spanner是谷歌第一个全球扩展支持外部一致性数据库
NoSQL(not only)
非关系型数据的统称,不采用关系模型,使用文档、列族、键值等非关系模型
无固定表结构,所以无连接操作、不严格遵守ACID约束
灵活可扩展性、灵活数据模型、与云计算紧密结合
大数据引发的数据库架构变革
一种架构支持多应用——>多架构支持多类应用
数据处理与分析
数据挖掘与机器学习算法
机器学习
数据挖缺
从大量数据中利用算法搜索隐藏信息
机器学习与数据库的交叉,机器学习算法分析海量数据,数据库的存储技术存储海量数据
典型算法
分类
聚类
回归分析
关联规则
大数据处理与分析技术
数据可视化
数据安全与隐私
可视化
数据可视化
由来
视觉重要:视觉获取的数据和信息比其他方式更好更快,大脑有感知规律性与无规律性的能力
图形(graph)重要:安斯库姆四重奏
概念
对事物建立心理模型或心理图像,利用人眼的感知能力对数据进行交互的可视化表达增强认知的技术
数据空间到图形空间的映射
支撑学科
数据分析
图形学
人机交互
案例
霍乱地图、玫瑰图、拿破仑桑基图
可视化流程
线性
数据分析、过滤、映射、绘制
每个过程的输入是上一步的输出
循环——应用广
数据处理加工过滤——可视形式——渲染为用户可见视图
用户交互,使每个步骤都变成循环
大数据可视化
概念:将大数据一图形图像形式表示,从而发现未知信息
基本思想
数据库中的每一个数据项作为单个图元素,大量数据集构成数据图像、数据的各个属性值以多维数据的形式表示
特点
有效筛选与精炼数据流
清晰有效地传达与沟通信息,更好地探索和理解复杂的数据
大数据分析分类
使用机器利用算法自动分析(非监督)
人利用领域内知识进行交互式分析(监督)—>为人提供直观、易理解的可视界面
可视形式
树形图-层次
网络图-关联关系
径向图
时间线-包含时间数据
标签云-文本数据
视频条形码-多媒体数据
大数据显示技术
多视图、分层、分块显示技术
可视分析技术
概念:大数据自动分析挖掘时,支持信息可视化的用户界面+支持分析过程人机交互技术,把计算机的计算能力与人类认知能力有效融合,获得对大数据的分析与认知
分类
时空数据、文本、网络、深度学习、多元数据
作用
观测、跟踪数据
数据分析与交互
辅助理解数据
增强数据吸引力
可视化技术
通用可视化技术
视觉感知与认知
格式塔原则-视觉形象作为统一整体被认知要满足:
接近性
相似性
连续性
闭合性
共势原则
好图原则(对象元素规则、简单有序)
可视编码
标记、用于控制标记的视觉特征的视觉通道组成
数据分类
类别型(男女)
有序型(老中青)
数值型(123)
视觉通道
数据值到标记的视觉表现属性的映射
色调、位置、形状
图形学渲染
实时
交互式应用如3D游戏、CAD
速度、资源、效果上折中
在普通前端如PC、移动终端、部分服务器资源
渲染API:openGL,DirectX
离线
复杂场景应用如电影动画
不考虑速度与资源,追求效果
运行在分布式并行集群
分类
数据类型划分
统计数据
图表,Echarts,matplotlib
关系数据
节点和边,流程图、网络图。mxgraph
地理空间数据
时间序列数据
文本数据
可视化图表类型
趋势型数据可视化
散点、折线、阶梯、时间序列图
对比型数据
柱状、雷达、气泡
比例型数据
饼图、堆垒柱形图、堆垒面积图
分布型数据
直方图、箱线图、概率密度图
箱线图
常用工具
地理大数据可视化分类
基础数据可视化
基础数据:与地理位置与自然形态强关联的数据类型
展现形式
矢量要素
点
描述地理空间中离散的点,有实际经纬度,无大小等具体属性
表示符号化后的兴趣点
可视化步骤
点选择
标识符号的选择
常用圆点、图标(ICON)、向量型可用箭头
点布局
直接布局
合理布局
解决数据量大的堆叠问题
合理布局、渲染融合
线
连接2个及以上地点的路径或线段
表示河流、行政区域
可视化
颜色、宽度、线型—属性;不同符号、标注展示信息
数据量大
简化、聚合、边捆绑(出发地与目的地相似的线段聚合,流程图与地图对的结合,流型图)
区域
表示国家、省市、湖泊、街区
可视化
分级统计图
制图区域的若干区划单元内根据单元属性的数量指标分级
变形地图
概念
按照地理区域属性对各个区域进行适当变形
特点
数据驱动的区域变化
核心在于根据变量大小周整区域大小
地理邻接
会保持邻近区域的相对位置,确保地理邻接关系的合理性
重点突出
视觉变形,使观者容易识别出数据集异常与趋势
规则形状地图
简单几何简化区域
几何图形容易判断面积大小
与原始拓扑相似的方式组织与定位形状区域
基础底图
拍摄得到影像数据
矢量地图栅格化得到的地图数据
地形地貌
DEM
DTM
环境特效
光照、阴影、天气
向量场
采样点数据为向量
应用
气象预报
海洋大气建模
可视化表达
图标逐个表示向量,如箭头、线条
承载数据可视化
轨迹数据
与地理位置强相关
属性:时空、举例、方向
分类:人类轨迹(主动和被动记录)、车辆轨迹、动物、自然想象
可视化
直接可视化
适合干净规则数据,噪声较多的数据绘制结果偏差大
聚集可视化
按聚集策略分
时空和属性聚集
关注轨迹数量随时间变化、轨迹的空间密度、属性分布
出发点—目的地聚集
出发-目的的流向数据,忽略中间段
路径聚集
聚类算法对轨迹聚类
特征可视化
提取轨迹特征,将特征可视化,eg道路通行状况随时间与路段的变化
富媒体
具有动画、声音或交互性信息的传播方法,与地理位置弱相关
典型
文本最普遍,承载丰富语义
文本可视化
文本中的时空属性不被显式记录,先提取,再与位置关联
融合数据可视化
并列或递进
视图联动
多种视图展示同一组数据
不同视图自然切换
网络关联
节点—链接形式
典型地理数据
众源地理数据
发展
地图产生
军用转民用
地图生产模式变化
便携、低成本GPS接收机出现—方便记录位置
web2.0—民众参与绘制地图
Turner定义新地理,民众按照自己的方式制作与使用地图,分享地理位置。
新地理受众、信息、呈现者、主题的角色、所有权、交互没有界限
goodchild提出VGI
普通民众在参与到各种社会活动过程中有意或无意地创建出的地理信息
heipke定义CGD,众源地理空间数据
大量非专业认识志愿获取并通过互联网向大众或各种机构提供的开放地理空间数据
概念
众源地理信息CGI
使用大众主动或被动产生的带有地理信息的数据,实现地理数据的快速更新和广泛应用的的相关理论和方法
与传统本质区别——来源广泛
数据来源
由特定部门与公司发布的公共版权数据
开源地图要素数据
OSM
更优质的本地知识
贡献者使用航空影像等确保精确性、时效性、更高现势性
WikiMapia
来自交通管理部门行驶数据
公众日常生活中有意或无意产生的空间数据
发布在社交网络上的共享的带有丰富地理信息的数据
分类
数据获取方式
主动VGI
用户自主决定数据内容
用户主动进行数据的创建、更新和维护
开放街景数据
被动VGI
用户无意识贡献
平台方定义收集的数据内容
社交媒体数据的定位和文本数据
数据载体的内容
空间数据CGI
与地理信息关联、具备实际空间意义
路网数据、兴趣点、带有地理标签的街景图像
非空间数据CGI
社交媒体数据
特点
数据量大
现势性强
传播速度快
信息覆盖面广
众源地理数据有传统地理数据没有的社会性
活动集中在城市,以交通为主要空间表现,本身包含丰富的位置信息、语义信息、行为信息
参与创建的广泛性—>多角度、多方面描述地理要素
成本低廉
缺点
缺乏统一规范
质量不确定
生产方式与过程不同——数据精度完整度差异大
生产动机多样——数据不确定性
覆盖不均匀
空间上分布不均匀,有些地区冗余、有些严重缺乏
隐私与安全难以控制
处理技术
数据采集
志愿者应招募而参加的采集
没有或鲜少有招募过程,志愿者有意识地自发参与--OSM、道路寻宝软件
没有招募过程,志愿者没有察觉到自己在采集地理数据,地理数据的产生是用户在参加某种活动的副产物
各类互联网公司收集用户信息,谷歌记录搜索记录,百度记录用户位置
数据获取
定义:数据的需求者得到其需要的众源地理数据的过程
区别于采集
采集的数据来源一定为数据的直接生产者
获取的数据来源除了是直接生产者,还有可能是数据的管理者
关系
数据采集者==数据需求者,获取与采集是同一过程
数据采集者!=数据需求者,获取数据是数据从管理者向需求者传播的过程
案例
百度迁徙数据平台
数据管理者与使用者,数据的采集和获取是同一个过程,数据获取的来源即安装了百度地图软件或装载了百度地图软件的用户。
百度地图慧眼
数据采集的管理者,不再是需求者,是数据提供者。百度数据的采集和专业人群的数据获取是两个一前一后的过程。
获取方式
1.网络下载--OSM、Google的开放建筑
2.依托合作关系--科研院所与机构的合作
3.商业购买
4.技术手段获取
OSM——地图界维基百科
时间:2004.7 Steve coast
功能
地图浏览
地图数据在线编辑
地图数据输出
GPS轨迹数据上传
数据获取方式
官网下载
通过JOSM、Merkaartor、Osmosis等软件下载,不适合大批量数据下载
调用地图API
第三方网站
数据分析
众源地理数据拓扑及无标度分析
众源地理数据是一种包含拓扑关系的数据结构
基于大量地理数据实证研究发现地理空间存在无标度特性
城市交通基础地理信息提取
对出行信息的挖掘
人类时空活动分析
人类动力学研究
城市居民群体活动规律
流数据
概念
流(flow)
对于一个系统,不同部分、要素之间,系统与外部环境之间都存在着物质、信息、能量等的移动或交换,从而形成各种形式的流。
地理流(geographical flow)
定义:地理对象从起点(origin)到终点(destination)位置间的流动定义为地理流
作用:
地理流体现了不同地理位置之间不同强度的联系,通常涵盖物质、信息、资金等的空间转移
改造地理空间格局,推动地理系统演化的关键因素
表示:有序点对多元组
时空坐标(X,Y,Z,T)
流的属性S
流空间(space of flow)
定义:不必地理邻接即可实现共享时间的实践物质组织
场所空间(space of place)
场所:区别与全球的经济活动或过程的地理位置与空间
场所空间:在区域尺度研究以距离为核心的,基于区域经济一体化的空间相互作用。
区别:
内涵,场所空间指特定地理位置和相对稳定的空间关系,比如地理位置、物理距离、地形地貌等,流空间是虚拟的空间,强调信息、资本、人员等的全球流动性和网络连接性对空间组织的影响
空间观,地点空间是固定的边界空间;流空间是动态的、流动的空间,全球不同地方都是紧密相连的。
代表学者,地点空间—Walter Christaller在城市体系分布规律研究中提出了六边形中心地理论,流空间的代表人物是社会学家卡斯特尔
研究重点,地点空间-强调地理位置如何决定社会经济活动的分布、区域发展的差异,流空间-区域发展研究考虑到更大尺度范围的流动性、节点和枢纽的组织能力在很大程度决定了其发展的能力和水平
发展
2010,网络时代到来,改变了以距离衰减效应为基本规律的传统认知,距离不再是解释空间相关的唯一测度
引入“流空间”概念表述全球信息网络
21世纪初,基于大数据的流空间研究萌芽
大量人类行为数据的积累
基于位置服务和社交媒体的大规模开放数据提供了丰富、详细和实时的信息,降低研究数据获取成本
研究热点
城市网络与人员移动
流空间模式
数据模型—图
有向图、无向图
邻接点与度
邻接矩阵
表达
起点、角度、长度表示流(类似向量)
丛集、随机、排斥—3*3*3=27
类型划分
单一模式
随机
全部随机
丛集
全部丛集,起点、终点扎堆,长度相等,几乎合体
聚散
起点或终点丛集,方向随机或排斥,长度任意,从一点散开或聚到一点
社区
起点、长度丛集,方向任意,
图示有明显分区特点,流集中分布在不同局部区域内,不同局部区域之间无交互或交互较少
并行
起点随机,角度丛集,长度任意,众多平行向量铺满
等长
长度丛集,其余任意
混合模式
丛集—聚集或丛集—扩散
举例:交通枢纽和枢纽之间的出租车流,交通枢纽之间的车流为丛集,交通枢纽与周边客流为聚散
社区—聚散
举例:不同学区内的家到学校之间的上下学流
丛集—社区
举例:不同城市功能区内部热点之间的出租车流
多源流模式
相关
正相关-同向
负相关-反向
排斥
一种流的局部范围内不存在或较少存在另一种形式流
独立
分布独立,无关
街景数据
概念
通过地面摄像设备拍摄的沿着街道和公共区域的全景图像和视频数据,通常包括道路、建筑物、街道设施、行人、车辆等城市景观的可视信息。
应用领域
地理信息、城市规划、导航系统、虚拟现实、增强现实、智能驾驶
视角
平行或自下而上的视角
遥感鸟瞰、自上而下的视角
特点
视角与覆盖范围
以360度全景图的形式出现,提供了完整的环境视图
从连续拍摄的图像拼接而成,可以覆盖长距离的街道或区域,形成导航的虚拟场景
空间信息与元数据
拍摄位置相关联的地理坐标与和拍摄时的方向信息
时间戳、拍摄设备信息,深度信息
类型
拍摄方式
全景
球形全景相机呈现360场景,可用于与真实地理坐标建立联系
街景图片
按照指定观测方向和图片大小投影街景全景的矩形区域生成
数据格式
视频、图片
数据来源
网络地图街景
社交媒体图片
街景图片志愿者平台
空中全景影像--无人机低空飞行拍摄
地面全景影像
提供商
分析方法
要素级感知-从城市环境中检测和提取空间对象、要素
语义分割
给定一个输入图像,该模型能够为每个像素分配一个类别标签
数据集
城市研究中使用最多的是cityscapes和ade20k数据集
cityscapes-对城市街道场景的语义理解,包含道路、行人、车辆等8个大类30个小类
ADE20K共包含150个类别,天空、道路、草地等,涵盖日常场景中的多数对象
目标检测
找出图像中所有感兴趣的目标,确定他们的大小和位置
图像分析
场景级感知-对整个场景进行整体评估并理解底层语义
图像分类
模式预测
行人情感分析
安全与隐私
数据安全
传统数据安全
威胁
黑客攻击
具有明确的目标
数据存储介质的损坏
天灾人祸
计算机病毒
影响计算机正常运行,破坏数据的正确与完整,甚至导致系统崩溃
信息安全理论
保密性
可用性
完整性
大数据安全
大数据成为网络攻击的显著攻击目标
加大泄露隐私风险
大数据被应用到攻击的手段中
成为高级可持续攻击的载体
地理大数据安全
地理信息安全
概念
必须严格的遵守国家的相关法律法规进行地理信息的使用,未经批准不得进行生产、复制、使用和传播
特征
主权性
涉密性
精确性-数据精准、内容丰富
基础性-四大基础大数据(人口、法人、地理信息、宏观经济)
共享性
问题
个人权益保障
国家安全维护
社会公共安全
企业知识产权
市场秩序维护
产业健康生态建立
安全问题
隐私和个人信息安全
国家安全
大数据是国家之间博弈的新战场
自媒体平台影响国家意识形态安全
地理大数据保护基本原则
保护与自由流通的平衡
原则
数据主权原则
一个国家独立自主地对本国数据的占有、控制、利用和保护的权力
数据保护原则
数据不是共同财产,数据的权属关系受法律的调整
数据由法律保护,数据的流通过程受到法律保护
数据自由流通原则
促进数据自由流通
反对数据垄断
数据安全原则
分类
安全形态
数据存储安全和数据传输安全
内容
信息网络软硬件安全、数据系统安全、数据系统中的数据安全
主体
国家、社会、企业、个人数据安全
保护实践
欧盟
GDPR ,general data protection regulation目的在与遏制个人信息被滥用、保护个人隐私
典型案例
棱镜门事件、维基解密、脸书数据滥用、手机应用过度采集个人信息、非法测绘、问题地图、涉密地图泄露