Modèle SARIMAX
2025-02-10
Le modèle SARIMAX désigne un outil statistique de projection pour des valeurs d'une série temporelle, il prend en compte :
- Saisonnalité : cyclicité ;
- AutoRégression : influence de valeurs précédentes ;
- Intégration : projections indépendantes des observations lissées ;
- Moyenne glissante : influence d'une erreur résiduelle ;
- Régresseurs exogènes : facteurs externes.
L'application du modèle est limitée aux données stationnaires, dont la moyenne[1] et la variance[2] sont stables dans le temps. Le test Augmenté de Dickey-Fuller peut-être utilisé pour vérifier qu'un jeu de données n'est pas stationnaire, en quel cas une série de soustractions peut être réalisée pour compenser la tendance : La moyenne glissante permet de lisser les données de sorte à obtenir une tendance générale. Par différence avec les données brutes, on peut ainsi celle-ci et obtenir un jeu stationnaire duquel la saisonnalité peut être retirée par la différence d'une saison à l'autre.
Un modèle peut être défini tel que :
ARIMA(p,d,q)(P,D,Q)m
Soit p l'ordre d'auto-régression (AR), d le degré de différenciation (I), q l'ordre de moyenne glissante (MA), et m le nombre d'éléments par saison (S).
Les ordres p et q sont généralement mis en évidence par auto-corrélation.