热度 1
ARIMA,就是autoregressive integrated moving-average model,中文应该叫做自动回归积分滑动平均模型,它主要使用与有长期趋势与季节性波动的时间序列的分析预测中。. m8 H0 O8 X+ B7 h) |
7 Q$ q! |' T4 t, {/ M8 i
ARIMA有6个参数,ARIMA (p,d,q)(sp,sd,sq),后三个是主要用来描述季节性的变化,前三个针对去除了季节性变化后序列。为了避免过度训练拟合,这些参数的取值都很小。p与sp的含义是一个数与前面几个数线性相关,这两参数大多数情况下都取0, 取1的情况很少,大于1的就几乎绝种了。d与sd是差分,difference,d是描述长期趋势,sd是季节性变化,这两个参数的取值几乎也都是 0,1,2,要做几次差分就取几作值。q与sq是平滑计算次数,如果序列变化特别剧烈,就要进行平滑计算,计算几次就取几做值,这两个值大多数情况下总有一个为0,也很少超过2的。
7 a8 S) d( j0 [ u4 |" u
9 O5 V) S$ j0 M8 t8 Q2 H6 a ARIMA的思路很简单,首先用差分去掉季节性波动,然后去掉长期趋势,然后平滑序列,然后用一个线性函数+白噪声的形式来拟合序列,就是不断的用前p个值来计算下一个值。6 ~* K/ m/ A8 z; b2 k6 ?% p
9 z$ n0 @; q4 y" R: `9 l9 }& \( i5 i
用SPSS来做ARIMA大概有这些步骤:# D/ T4 g7 t) `4 k) ^
1定义日期,确定季节性的周期,菜单为Data-Define dates' s; d% A9 e) j
2画序列图来观察数值变化,菜单为Graph-sequence / Time Series - autoregressive/ l1 [( X4 `9 s" ?6 S) y
3若存在季节性波动,则做季节性差分,Graph- Time Series - autoregressive,先做一次,返回2观察,如果数列还存在季节性波动,就再做一次,需要做几次,sd就取几7 k4 x, J2 `4 K0 C( C; I0 h
4若观察到差分后的数列中有某些值远远大于平均值,则需要做平滑,做几次sq就取几: M1 y; B/ i# H+ d/ u) N" z
5然后看是否需要做去除长期趋势的差分,确定p与sp2 d7 O" `: i, e* D) a7 ~3 P
6然后在ARIMA模型中测试是否存在其他属性影响预测属性,如果Approx sig接近0,则说明该属性可以加入模型,作为独立变量,值得注意的是,如果存在突变,可以根据情况自定义变量,这个在判断突变的原因比重时特别有用。9 i+ i! Y% h* y6 }& l% f, h; D
7然后用以确定的参数与独立变量进行拟合预测。9 E$ P6 r w. A+ b" g
8最后,用Graph- Time Series - autoregressive来判断一下拟合产生的误差ERR,如果不存在明显特征,可以看作是无规律的随机白噪声,就可以认为建模成功。
9 s' w7 d/ t- c8 S. i1 n9最后使用ARIMA模型进行预测即可$ Y# X/ E1 W6 F. H
感觉在电信行业的KPI预测中,最有应用前景的是第六步,除了可以找到那些变量对目标值有影响外,还能确定在目标属性的变化中,不同原因的影响比例,如多少程度是由于竞争对手的失误,多少程度是因为自己表现好,多少程度是因为市场大环境变化了。此外,通过预测值,可以指导计划的编制和指标的制定,还能起到一点业务预警的作用。意义并不是很大,不过总比没有好~~
免责声明|关于我们|小黑屋|联系我们|赞助我们|统计211
( 闽ICP备09019626号 )
GMT+8, 2025-5-1 14:36 , Processed in 0.050426 second(s), 20 queries .
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.