导图社区 时序数据
这是一篇关于时序数据1的思维导图。时序数据是指时间序列数据,时间序列数据是同一统一指标按时间顺序记录的数据列。
社区模板帮助中心,点此进入>>
安全教育的重要性
个人日常活动安排思维导图
西游记主要人物性格分析
17种头脑风暴法
如何令自己更快乐
头脑风暴法四个原则
思维导图
第二职业规划书
记一篇有颜又有料的笔记-by babe
伯赞学习技巧
时序数据
linear(Lt)
ARIMA
假设
1. 未来数据线性依赖当前和过去的数据
2. 存在的数据没有缺失
组成及主要参数
AR模型(p):描述当前值和历史(p个时间点)值之间的关系,可以通过PACF图观察选取p值
I差分(d):将不平稳的时间序列转化为(弱)平稳的时间序列。简单的方法判断是否平稳:均值和方差处于平稳(严格来说应该是所有统计量都是独立于时间的)
MA模型(q): 滑动平均部分,描述(前q个时间点的)误差之间的关系,可以通过ACF图,判断选取q参数
步骤
stationary identification(静态检验):对数据绘图,观测是否为平稳时间序列,对非平稳时间序列进行d阶差分,化为平稳,获得d参数
将获得的平稳时间序列求自相关系数ACF和偏自相关系数PACF,通过自相关图和偏自相关图的分析,获得阶层p和阶数q
使用p,d,q构建ARIMA模型进行检验和预测
静态检验
ADF检测(Augmented Dickey Fuller )
结果越负说明数据越静态
阈值为0.05
可以用来调节MA filter的长度(通过这个过滤器将时序数据分为线性和非线性两个部分)
Multi-scale decomposition Methods
EMD(Empirical Mode Decomposition)(相对更好)
WPD(Wavelet Packet Decomposition)
FT(Fourier Transform)
nonlinear(Nt)
ANN
linear+nonlinear
混合模型
区分线性和非线性组分(error sequences 也不一定是非线性的)
不同组分不一定是简单的相加关系(可能是乘除等其他的)
yt = Lt + Nt
yt = f(Lt, Nt)
liner + nonliner + other
EMD+linear+residual
1. 通过EMD将时序数据分成多个子静态时序数据和剩下残渣数据的和
2. 计算每个子静态数据的预测值,和残渣数据的预测值
3. 所有结果加起来即为最后的预测
计量基础
协方差(有量纲),相关系数(无量纲)
只刻画X和Y之间的线性关系,不描述任何非线性关系
平稳型检验
弱平稳
均值平稳
方差平稳
ADF检验
自相关检验
通过不同滞后的相关图发现结果
周期性
趋势
原始时间序列和拟合时间序列的残差的相关图
残差相关图平稳说明残差是随机噪声
残差的相关图体现了额外的自相关性,说明拟合的图缺少了部分时间相关信息
基础时序模型
白噪声
序列不相关
优秀的时序模型拟合出来的残差序列应该近似为白噪声
随机游走
x(t) = x(t-1)+v(t), v(t)是均值0,方差a白噪声
因为方差(t*a2)是白噪声方差的函数,所以不是稳定的, 时间越大,波动性越强
时序模型
ARMA
聚类
基于距离的算法:KMeans
时序降维
在线
非在线
PAA
待定
时间序列的符号化表示:SAX
LTTB
序列重要点分割
滑动窗口
https://blog.csdn.net/weixin_44602176/article/details/109074205
自顶向下
自底向上
时间序列分割聚类算法:TICC