J'essaie de comprendre un article sur la prévision de la charge électrique, mais je me bats avec les concepts à l'intérieur, en particulier le modèle SARIMAX . Ce modèle est utilisé pour prédire la charge et utilise de nombreux concepts statistiques que je ne comprends pas (je suis un étudiant en informatique de premier cycle - vous pouvez me considérer comme un profane en statistique). Il n'est pas nécessaire pour moi de comprendre complètement comment cela fonctionne, mais j'aimerais au moins comprendre intuitivement ce qui se passe.
J'ai essayé de diviser SARIMAX en petits morceaux et d'essayer de comprendre chacun de ces morceaux séparément, puis de les assembler. Pouvez-vous m'aider? Voici ce que j'ai jusqu'à présent.
J'ai commencé avec AR et MA.
AR : autorégressif . J'ai appris ce qu'est une régression et d'après ma compréhension, elle répond simplement à la question: étant donné un ensemble de valeurs / points, comment puis-je trouver un modèle qui explique ces valeurs? Nous avons donc, par exemple, la régression linéaire, qui essaie de trouver une droite qui peut expliquer tous ces points. Une autorégression est une régression qui tente d'expliquer les valeurs à l'aide de leurs valeurs précédentes.
MA : Moyenne mobile . Je suis en fait assez perdu ici. Je sais ce qu'est une moyenne mobile, mais le modèle de moyenne mobile ne semble avoir rien à voir avec la moyenne mobile "normale". La formule du modèle semble étrangement similaire à AR et je n'arrive pas à comprendre l'un des concepts que je trouve sur Internet. Quel est le but de MA? Quelle est la différence entre MA et AR?
Alors maintenant, nous avons ARMA. Le I vient alors d' Integrated , qui, à ce que j'ai compris, sert simplement à permettre au modèle ARMA d'avoir une tendance, soit à la hausse, soit à la baisse. (Est-ce que cela revient à dire qu'ARIMA lui permet d'être non stationnaire?)
Vient maintenant le S de saisonnier , qui ajoute de la périodicité à ARIMA, qui dit essentiellement, par exemple dans le cas de la prévision de charge, que la charge semble très similaire tous les jours à 18 heures.
Enfin le X , issu de variables exogènes , qui permet essentiellement de prendre en compte des variables externes dans le modèle, comme les prévisions météorologiques.
Nous avons donc enfin SARIMAX! Mes explications sont-elles correctes? Reconnaissez que ces explications ne doivent pas nécessairement être rigoureusement correctes. Quelqu'un peut-il m'expliquer ce que MA fait intuitivement?