UTO:时间序列该如何权衡平稳性和记忆力?_TUTOR

许多预测模型都要求时间序列具有一定的一致性,即“平稳性”。平常的转换,即整数阶差分(譬如,在金融学中表现为建模收益而不是绝对价格),消除了数据中的记忆,从而影响了建模的预测能力。

本文概述了分数微积分如何保留更多的信息,以及如何更好地在平稳性和有意义的记忆之间做出权衡。

一般而言,我们会把一个给定的时间序列理解为一个随机过程产生的样本,并试图推断出其分布及统计数据以建立一个预测模型。

建立随机过程的预测模型是为了平衡样本的特殊性和一般性:该模型根据一般模式的背景对给定的序列做出解释。

比一般预测回归更具体的是,由于时间结构的原因,时间序列一般具有其固有顺序。任何给定的实例都反映了其发展变化情况,即过去跟踪记录的特定记忆。

平稳性

为了确定生成过程的一般模式并映射给定的排列,在实际建模之前我们通常将此特定序列的记忆作为预处理步骤的一部分予以删除。

在机器学习领域的监督学习中,该序列可以发现一般性结构并对给定的实例与标记训练集中更多的样本进行匹配。

在数学领域,过程的统计特性不会因时间顺序的改变而变化,这意味着系列不会随时间推移而呈现出一种趋势。该概念被称为平稳性。

检查时间序列平稳性的方法有很多种:

观察线形图,寻找一段时间内的明显的趋势。比较数列中各种分割的基本汇总统计数据。观察自相关图:曲线下降越快,滞后越明显,序列的非平稳性阶数越小。最常见的平稳性统计检验是单位根的ADF检验。

单位根是指初始条件或外部冲击不会随着时间的推移而消散,而是通过该序列传播,并通知所有后续值。该含义从直观上正式地解决了在单位圆上的过程特征方程。

对于给定的置信水平,ADF测试零假设“序列中存在单位根”以及序列稳定性的替代。它直接证明了,单位根的存在确实意味着该序列的不稳定。

分数阶微积分

事实上,在17世纪牛顿和莱布尼茨发明微积分后不久,数学家们就对分数阶导数的使用进行了探索,将微分或积分的顺序从自然数扩展到实数。然而,其应采纳赫斯特和曼德尔布罗特在20世纪的成果,为分数微积分找到初期的自然应用,并使其与霍斯金和格兰杰于20世纪80年代创建的Arfima模型一同进入金融领域。

大约在1730年,欧拉就该归纳给出有史以来第一个启发式,通过函数将二项式系数推广到实数阶。后来,在黎曼和刘维尔的积分理论中,重复微分的柯西公式使之变得更加严谨。

这里,我们仅仅给出了时间序列差分应用程序的形式启发式:

B表示滞后操作符,即对于t>1,BX_t=X_{t-1}和某个时间序列X={X_1,...}。一阶元素阶差分可以用恒等算子I表示,如下:

金融时间序列建模的应用

在金融领域,时间序列起主导作用。为了更好地理解分数阶差分的特征,我们将其应用于一些典型的金融时间序列。

利用以下代码,将差分算子的上述形式序列的展开式应用到指定实阶d和固定窗口大小的时间序列上,得到变换后的序列,然后只需将一个pandas时间序列输入参数阶和lag_cutoff的ts_difference函数中即可。

2016-2018年比特币的价格(红色,右轴),以及部分衍生品(蓝色阴影)

正如你可能已注意到的,比特币的价格在2017年和2018年经历了一次明显的炒作。实际上,看看一阶差分,我们发现价格在某些日期上涨了2500美元以上。上图展示了一些分数阶差分的平滑函数插值。这似乎很奇怪,在如此强劲的趋势下,约0.4的弱差分实际上竟足以使该序列呈平稳型:给定样本的ADF统计量为-5,其已低于DFt-分布的临界值-2.86,因此在置信度为95%下,该序列可以假定是平稳的。的确,随着财富的来回变动,它很快就变得吝啬起来。

低阶差分足以满足平稳性的结论与其他许多金融时间序列相似。

为了说明平稳性和记忆之间的权衡,我们可以进行适当的可视化,并将ADF测试统计数据以及与原始序列的相关性绘制成具有不同阶差变换的序列。。

对于商品期货、汇率、指数等各种典型的金融序列,这种对比清晰地表明了差阶满足金融建模的平稳性条件,同时保留了特定的记忆结构,从而保持了原始序列的统计动态。

ADF检验统计量(左轴,红色曲线)和线性相关(右轴,矢状花蓝色曲线)与原序列进行各种分数阶差分,应用于各种金融时间序列。石板灰中的常数线表示ADF检验的显著性水平为95%。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:0ms0-4:129ms