导图社区 时间序列分析
时间序列分析是指将原来的销售分解为四部分来看——趋势、周期、时期和不稳定因素,然后综合这些因素,提出销售预测。
编辑于2022-03-28 00:49:06时间序列分析
第一章 时间序列简介
时间序列的定义
在统计研究中,常用按时间顺序排列的一组随机变量 X1,X2,…,Xt,… 来表示一个随机序列的时间序列,简记为{Xt,t∈T} 或 {Xt}。
时间序列分析方法
描述性时间序列分析
定义:通过直观的数据比较或者绘图观测,寻找序列中蕴涵的发展规律的分析方法。
特点:操作简单、直观有效。
统计时序分析
频域分析方法
又称为频谱分析或谱分析
是一种非常有用的纵向数据分析方法。 但过程复杂,不易操作;结果抽象,难以直观解释。
时域分析方法
特点:理论基础扎实(word分解定理、Gamer分解定理), 操作步骤规范,分析结果易解释。
时间序列确定性因素分解
四类趋势:长期趋势T、季节变动S、循环波动C、随机波动I
主要函数形式
加法模型:xt=Tt+St+Ct+It;
乘法模型:xt=Tt•St•Ct•It;
混合模型
时间序列分析软件
常见有:S-plus,Matlab,Gauss,EViews,R和SAS。
第二章 时间序列的预处理
平稳序列的定义
特征统计量
均值ut=EXt =
方差(σt)^2 =DXt =E(Xt-ut)^2 =
自协方差函数γ(t,s)= E(Xt-ut)(Xs-us) , 自相关系数ρ(t,s)=γ(t,s)/
定义
严平稳
对于增加任意时间间隔的多元分布保持不变。
宽平稳
定义: {Xt}满足①二阶矩存在(方差存在),②期望为常数,③自协方差函数只与时间间隔相关,与起点终点无关。
严平稳能推出宽平稳,不能反推。
统计性质
①常数均值;
②自协方差函数和自相关系数只依赖于时间的平移长度而与时间的起止点无关。
延迟k自协方差函数:常数方差。
延迟k自相关系数:规范性;对称性;非负定性;对应模型的非唯一性。
意义
形式:多值一变量
减少了随机变量个数,增加了样本容量
简化时序分析难度
特高特征统计量估计精度
平稳序列分析的理论基础
Word分解定理
认为对于任意一个的离散平稳时间序列{xt}可分为一个确定性序列和随机序列(两序列不相关)。
平稳序列的特征根
平稳性检验
图检验
原理:平稳时间序列具有常数均值和方差。即时序图显示序列在一个常数值附近波动,且波动范围有界。 若存在趋势性或周期性,则不是平稳序列。
具有很强的主观性,不适合趋势与周期不明显的序列。
DF检验
表达式:Xt=Φ1x(t-1)+εt
特征根λ=Φ1
判断标准:|Φ1|<1 →序列平稳;|Φ1|≥1→序列非平稳。
ρ=|Φ1| - 1
判断标准:ρ<0→序列平稳;ρ≥0→序列非平稳。
ADF检验
序列表达式:xt=Φ1•xt-1 + Φ2•xt-2 +…+Φp•xt-p + εt
特征方程:λ^p - Φ1•λ^(p-1)- … - Φp = 0
假设非零特征根为:λ1,λ2,…,λp
判断标准:|λi|<1,i=1,2,…,p →序列平稳
纯随机性检验 (白噪声序列)
最简单的平稳序列
Xt~WN(u,σ^2)
性质
纯随机性
γ(k)=0,∀k≠0
各序列间没有任何关系。
方差齐性
D(X t )=γ(0)=σ ^2
根据马尔可夫定理,方差齐性时,用OLS 估计参数才具有Blue。
检验
原理:Bartlett定理
ρk(估计)~N(0, 1/n) ,∀k ≠0(近似服从)
条件:
H 0:ρ 1 =ρ 2 =⋯=ρ m =0,∀m≥1
H 1 :至少存在某个ρk≠0,∀m≥1,k≤m
检验统计量
Q统计量
LB 统计量
LB
第三章 ARMA模型的性质
AR模型
具有如下结构的模型称为p阶自回归模型,简记为AR(p):
xt=Φ0 + Φ1xt-1 +……+ Φpxt-p + εt
条件:①Φp≠0。②E(εt)=0,Var(εt)=(σε)^2,E(εtεs)=0,s≠t。{ε}为零均值白噪声序列。③E(xsεt)=0,∀s<t。
Φ0=0时,自回归模型又称为中心化AR(p)模型。
延迟算子Φ(B)。模型简记:Φ(B)xt=εt。其中Φ(B)=1-Φ1B-Φ2B^2-ΦpB^p,为p阶自回归系数多项式。
MA模型
具有如下结构的模型称为q阶自回归模型,简记为MA(q):
xt=μ + εt - θ1εt-1 - … - θqεt-q
条件:①θq≠0。②E(εt)=0,Var(εt)=(σε)^2,E(εtεs)=0,s≠t。{ε}为零均值白噪声序列。
延迟算子θ(B)。模型简记:xt=θ(B)εt。其中θ(B)=1-θ1B-θ2B^2-…-θqB^q,为q阶移动平均系数多项式。
ARMA模型
ARMA模型是最常用的平稳序列拟合模型,随机变量Xt的取值xt不仅与以前p期的序列值有 关还与前q期的随机扰动有关。
联系
当q=0时,ARMA(p, q)模型就退化成了AR(p)模型;
当p=0时,ARMA(p, q)模型就退化成了MA(q)模型。
所以,AR(p)模型和MA(q)模型实际上是ARMA(p, q)模型的特例,它们都统称为ARMA模型。
平稳性
ARMA模型的平稳性完全由其自回归部分的平稳性所决定。
统计性质
均值
Ext = Φ0 / (1 - Φ1 -… - Φp)
自协方差函数
γk=(σε)^2
自相关系数和偏自相关系数
ARMA模型的自相关系数和偏自相关系数均为拖尾。
第四章 平稳序列的拟合与预测
建模步骤
判定为平稳非白噪声序列。
模型识别
求序列的样本自相关系数ρk和样本偏自相关系数Φkk 。
规则:参考ARMA模型的 ρ k 和Φkk 拖尾、截尾对模型进行判断。
当样本容量n充分大时,样本的ρ k和Φkk都是近似于正态分布, 根据正态分布的性质,可以利用2倍标准差范围辅助判断。
参数估计
非中心化和中心化区别
非中心化ARMA( p ,q)模型, xt=μ+(θq(B))/Φp(B)εt , εt~WN(0,(σε)^2)
有p+q+2个未知参数,其中参数μ通常采用距估计的方法。μ=x_(平均)
当序列中性化,有 yt=xt-x_(平均),则只有p+q+1个参数。
距估计
构造Yule-Walker方程,求解出的值就是未知参数的距估计值。
极大似然估计
注意:要已知总体分布。构造似然函数,使偏导为0,计算出各估计值。
最小二乘估计
假定xt=0,t≤0时,要使残差平方和达到最小(迭代法)的参数估计值。
模型检验
模型的显著性检验
主要检验模型的有效性,即残差是否为白噪声序列。
H0:ρ1=ρ2=…=ρm=0,∀m≥1 H1:至少存在某个ρk≠0,∀m≥1,k≤m
检验统计量:LB
若拒绝原假设,则拟合模型不显著,需重新选择模型拟合。
参数的显著性检验
为了使模型最精简,即检验模型的每个参数是否显著非零。
H0:βj=0;H1:βj≠0,∀1≤j≤m
t检验统计量:
或者 p<α,拒绝原假设,认为参数显著非零 , 该模型拟合效果好。
模型优化
问题提出:同一个序列可以构造多个拟合模型,且都显著有效,那么模型如何选择?
AIC准则
最小信息量准则;指导思想:①似然函数值②未知参数个数。
通常,似然函数值越大,模型拟合效果越好;未知参数越多,模型未知风险越多。
AIC函数
中心化ARMA(p,q) :AIC=nln(σε)^2 + 2(p+q+1 )
非中心化ARMA:AIC=nln(σε)^2 + 2(p+q+2 )
SBC准则
又称BIC准则,判定规则与AIC准则一样。
是最优模型的真实阶数的相合估计。
SBC函数
中心化:SBC=nln(σε)^2 +( lnn)(p+q+1 )
非中心化:SBC=nln(σε)^2 +( lnn)(p+q+2)
序列预测
线性预测函数
根据平稳ARMA的可逆性,用AR结构表示ARMA模型。∑Ijxt-j =εt 。
预测方差最小原则
et(l)=xt+l-xt(l).预测误差越小,预测精度越高。
线性最小方差预测的性质
条件无偏最小方差估计值
AR(p)序列预测
Var[et(l)]=(1+G1^2+…+Gl-1^2)(σε)^2