如何用Python做舆情时间序列可视化?
尽管我们针对时间序列模型专门撰写了一系列大数据分析培训课程python时间序列预测SARIMAX模型教程文章,但我们尚未讨论一个非常重要的主题-季节性。
到目前为止,我们检查的每个模型-AR,MA,ARMA,ARIMA或ARIMAX都有季节性等效项。
您可能会猜到,这些对应项的名称分别是SARMA,SARIMA和SARIMAX,其中“ S”代表季节性。
因此,模型的全名将是季节性自回归综合移动平均外生模型。
我们都可以同意这是一个嘴,所以我们会坚持使用缩写。
此外,SARMA和SARIMA可以看作是SARIMAX的简单案例,在这里我们不使用积分或外生变量,因此在大数据分析培训课程python时间序列预测SARIMAX模型教程中,我们将主要关注SARIMAX。
什么是季节性?
如果需要提示,当某些模式不一致时会发生季节性变化,但会周期性出现。例如,每周查看YouTube搜索的圣诞节歌曲,例如“ Jingle Bells ”。
在每年的12月的节日期间,这种情况的发生频率更高。但是,这些歌曲的播放次数通常在6月或7月要低得多。
因此,简单的自回归组件不能很好地描述数据。
详细地说,一个简单的AR组件会严重地低估基于11月(滞后1年)的统计数据,圣诞节歌曲在12月播放的次数。同时,它也将大大夸大1月份的数字,以12月份记录的数值为基础,因为这种类型通常在圣诞节后有所下降。
我们如何处理季节性问题?
为了说明这种模式,我们需要将上一个节日期间记录的值包括到模型中。在此特定示例中,这意味着要依赖于去年12月播放歌曲的次数。当然,我们还可以包含两个12月甚至更晚的数据。
有点像有另一个系列比我们最初的系列在时间上进一步扩展。回到音乐示例,原始时间序列包含相隔一个月的值,而季节性序列包含相隔12个月的值。
SARIMAX模型定义
现在我们已经熟悉了季节性模型的一般概念,接下来让我们看看我们使用的符号以及每个值的含义。与ARIMAX相比,SARIMAX需要另外4个订单。
这听起来可能很多,但无需担心!
这4个订单中的前3个只是ARIMA订单的季节性版本。
换句话说,我们有一个以大写字母P表示的季节性自回归阶,以大写字母D表示的季节性积分阶和以大写Q表示的季节性移动平均阶。为便于区分,计量经济学家同意使用小写字母表示非季节性的字母。
第四个也是最后一个顺序是循环的长度。例如,如果我们有每小时的数据,并且周期长度为24,则季节性模式每24小时出现一次。
季节性模型的周期长度是多少?
另一种思考的方式是“趋势重新出现之前必须经过的时间段数”。如果要检查季节性趋势,则需要确保设置适当的周期长度。我们用小写的“ s”表示最后一个订单,因为它设置了每个季节的时长。
我们如何解释季节性订单?
让我们快速解释这四个新订单如何协同工作。
本质上,长度“ s”表示季节要素与当前期间的距离。因此,如果我们有一个季节顺序为(2,0,1和5)的模型,那么我们将包括5、10个周期之前的滞后值以及5个周期之前的误差项。大数据分析培训课程python时间序列预测SARIMAX模型教程https://www.aaa-cg.com.cn/data/2434.html每个周期为“ 5”个周期,我们采用2个滞后的季节性值。因此,我们仅包括5和10个周期前的值。同样,我们添加了5个周期前的误差项。
概括地说,我们对每个“ s”值都感兴趣。我们从第“ s”个开始,一直到“ s,乘以p”。季节性积分值和季节性误差也是如此。
SARIMAX模型的方程是什么?
让我们看看阶(1,0,1)和季节性阶(2,0,1,5)的SARIMAX模型的方程是什么样的。
有趣的是,每个季节性要素还包含其他滞后值。如果要了解原因,可在此处找到SARIMAX模型背后数学的详细说明。
那么,从方程式中我们可以看到什么呢?我们估计的系数总数等于季节性和非季节性AR和MA订单的总和。换句话说,我们正在查看“ P加Q,加p加q”的总数–许多系数。
非季节性的用小写的?和θ表示; 而其季节性对应物分别用大写Φ和Θ表示。就像订单一样,大写字母表示季节性成分,小写字母表示非季节性成分。
因此,这是您需要的季节性模型的基本知识。但是,如果您想了解有关时间序列和时间序列数据的更多信息,请务必查看有关该主题的文章。
如果您不熟悉 Python,并且热衷于了解更多信息,那么这篇有关学习Python编程的综合文章将指导您从安装到Python IDE,库和框架,再到最佳Python职业发展道路,以及工作前景。
https://www.toutiao.com/i6849974616836964867/
Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有