导图社区 初识ETL
ETL是用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。下图将带你初步了解ETL。
这是一篇关于语文思维导图,总结的初中和高中阶段中的常用、常见的逻辑关系,举出简单的例子。希望对你有所帮助!
网络爬虫入门知识总结,解释了什么是网络爬虫、为什么需要网络爬虫、爬虫的合法性、爬虫的应用场景、爬虫类型等。
这是一个网络爬虫的入门知识,可能会比较杂乱,但也是认真总结了,包括什么是网络爬虫、为什么需要网络、爬虫爬虫的合法性、爬虫的应用场景、爬虫类型。做的不好,还请见谅。
社区模板帮助中心,点此进入>>
英语词性
互联网9大思维
安全教育的重要性
组织架构-单商户商城webAPP 思维导图。
法理
刑法总则
【华政插班生】文学常识-先秦
【华政插班生】文学常识-秦汉
文学常识:魏晋南北朝
【华政插班生】文学常识-隋唐五代
初识ETL
ETL关键技术
数据的抽取
从异构数据源抽取数据
增量抽取
触发器方式
时间戳方式
全表对比方式
日志表方式
全量抽取
数据的清洗转换
按目的要求进行数据的清洗转换
不完整的数据
错误的数据
重复的数据
数据的加载
ETL最后阶段
从临时位置加载到指定位置
全量加载
批量加载
增量加载
全表删除插入方式
ETL常见工具软件
Pentaho Kettle
Hawk
Informatica PowerCenter
DataStage
ETL的概念
描述数据从源加载转换到目的端的过程
抽取 extract
转换 transform
加载 load
基于ETL的数据清洗
基于ETL的数据清洗是挖掘有价值的数据的一种方案
借助ETL工具
编写SQL工具
ETL工具和SQL结合使用