时间序列
是指将数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。经济数据中大多数以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。如某股票的每天的收盘价,餐馆的每天进餐人数,地球每天的极移X、Y变化量,卫星钟每天的钟差,每天的最高气温等等都构成时间序列。
平稳检验
时间序列分析要求序列是平稳的,任意连续的K个时间序列的联合概率分布只与序列长度K有关,与长度为K的序列的其实时间无关。
通常简化为通过为ADF检验来判断时间序列是否平稳,若ADF检验的P值小于0.05,则拒绝原假设,认为时间序列平稳。
白噪声检验
时间序列分析对白噪声无法分析,时间序列分析时要检验该序列是不是白噪声,通常采样LB检验,若存在某阶的P值小于0.05,则可以拒绝原假设,认为该序列不是白噪声,可以进行时间序列分析。
差分
对于非平稳的时间序列可以通过差分,分析差分序列是否平稳,如果依然不平稳可以多阶差分。
AR
自回归,对时间序列,如果任意t时刻的值与其前P个时刻(t-1,t-2,...,t-p)有如下回归关系。
Xt=w0+w1*X(t-1)+...+Wp*X(t-p),其中W为自回归系数。
其中p为自回归的阶数。大于p的时刻(t-(p+1))与t时刻的回归系数显著为0。该系列p阶自回归。
MA
移动平局,对时间序列,如果任意t时刻的值Xt是其前q个时刻(t-1,t-2,...,t-p)的均值。
Xt=(Xt-1+Xt-2+...+Xt-q)/q
其中,q为移动平均的阶数。
该时间序列可以通过移动平均来预测。
ARMA
Xt时刻的值是前p时刻的回归与q时刻的移动平均的组合。
ARIMA
其中“I”,表示对非平稳的时间序列进行差分。差分的次数为差分的阶数d。差分平稳后再进行分析。
SARIMA
时间序列往往具有周期性,如餐馆的每天的营业额,以7天一周为周期。
非季节参数:
p: AR(p),非季节自回归的阶数
对于AR模型,可以借助PACF确定阶数p(ACF:拖尾,PACF:p阶截尾)。
d: I(d),差分的次数(Xt-X(t-1))
q: MA(q),非季节移动平均的阶数
MA模型的自相关函数具有截尾性,即自相关函数在k>q后为零(PACF:拖尾,ACF:q阶截尾)。
季节参数:
P: 季节自回归的阶数(通常不会大于3)
Xt=w0+w1*X(t-s)+...+Wp*X(t-p*s)
和小p相似,但时间序列步长为s,同样可以从PACF推断,如果季节长度为12,看PACF图上滞后12阶、24阶、48阶时的偏自相关系数,如果滞后到24阶时表现显著,那么P等于2。
D: 季节差分的次数(通常不会大于1)(Xt-X(t-s))
一般就是 0 或 1,做了季节差分就是 1。
Q: 季节移动平均的阶数(通常不会大于3)
同P,没有AR部分时,看ACF,滞后12阶、24阶、48阶、72阶...时的自相关系数,最大第几轮表现显著就是几。
Xt=(Xt-s+Xt-2*s+...+Xt-q*s)/q
s: 季节长度,或者说是周期大小
SARIMAX
如果存在外生变量可以使用SARIMAX。
参数的确定
时间序列分析时参数确定可以通过自相关图与偏相关图是截尾还是拖尾确定。
但更多还是通过穷举搜索找到最好的参数PDQ。
通过指标AIC或BIC评价。