Quel est le but de l'autocorrélation?


22

Pourquoi l' autocorrélation est-elle si importante? J'en ai compris le principe (je suppose ..) mais comme il y a aussi des exemples où aucune autocorrélation ne se produit, je me demande: tout n'est pas dans la nature en quelque sorte autocorrélé? Le dernier aspect vise plus à une compréhension générale de l'autocorrélation elle-même parce que, comme je l'ai mentionné, tous les états de l'univers ne dépendent-ils pas du précédent?


1
J'aime cette question, bien qu'elle soit un peu trop philosophique de mon point de vue :) Je peux donner un contexte historique qui pourrait être utile. Je pense qu'en ce qui concerne le traitement du signal, cela a beaucoup à voir avec l'estimation spectrale. Examinez l'estimation spectrale et les densités spectrales de puissance à partir de quantités finies de données. Cela pourrait vous donner une idée de pourquoi l'autocorrélation est (ou plutôt était) si importante.
idnavid

4
Je ne comprends pas la question dans votre titre. Cela ne sert à rien , c'est juste une propriété de données qui doit être prise en compte dans certains types d'analyses. Pourquoi c'est important est probablement responsable.
mkt

1
Tout dans la nature n'est-il pas en quelque sorte autocorrélé? Les phénomènes qui ne sont pas des séries chronologiques ne seraient pas autocorrélés, car l'autocorrélation est une propriété d'une série chronologique (bien qu'il existe des notions de corrélation spatiale et autres pour refléter les relations le long de dimensions autres que le temps). Mais comme tout se déroule dans le temps, l'autocorrélation pourrait en effet être assez omniprésente.
Richard Hardy

1
Si tout dans la nature est en quelque sorte autocorrélé, il me semble que l'autocorrélation est un gros problème!
David

2
" Pourquoi l' autocorrélation est-elle si importante?" : Prospection des cristaux de temps , bien sûr!
Nat

Réponses:


6

L'autocorrélation a plusieurs interprétations en langage simple qui signifient que les processus et modèles non autocorrélés ne:

  • Une variable autocorrélée a en mémoire ses valeurs précédentes. Ces variables ont un comportement qui dépend de ce qui s'est passé auparavant. La mémoire peut être longue ou courte par rapport à la période d'observation; la mémoire peut être infinie; la mémoire peut être négative (c'est-à-dire qu'elle peut osciller). Si vos théories directrices disent que le passé (d'une variable) reste avec nous, alors l'autocorrélation en est une expression. (Voir, par exemple, Boef, SD (2001). Modélisation des relations d'équilibre: modèles de correction d'erreurs avec des données fortement autorégressives . Political Analysis , 9 (1), 78–94, ainsi que de Boef, S., et Keele, L. ( 2008). Prendre le temps au sérieux . American Journal of Political Science , 52 (1), 184–200.)

  • Une variable autocorrélée implique un système dynamique . Les questions que nous posons et auxquelles nous répondons sur le comportement des systèmes dynamiques sont différentes de celles que nous posons sur les systèmes non dynamiques. Par exemple, lorsque les effets causaux pénètrent dans un système, et combien de temps les effets d'une perturbation à un moment donné restent pertinents sont répondus dans le langage des modèles autocorrélés. (Voir, par exemple, Levins, R. (1998). Dialectics and Systems Theory . Science & Society , 62 (3), 375–399, mais aussi la citation pesaréenne ci-dessous.)

  • Une variable autocorrélée implique un besoin de modélisation de séries chronologiques (sinon de modélisation de systèmes dynamiques également). Les méthodologies de séries chronologiques reposent sur des comportements autorégressifs (et une moyenne mobile, qui est une hypothèse de modélisation concernant la structure des erreurs en fonction du temps), tentant de capturer les détails saillants du processus de génération de données , et se distinguent nettement, par exemple, de la manière suivante: appelés «modèles longitudinaux» qui incorporent simplement une certaine mesure du temps comme variable dans un modèle par ailleurs non dynamique sans autocorrélation. Voir, par exemple, Pesaran, MH (2015) Time Series and Panel Data in Econometrics , New York, NY: Oxford University Press.

Avertissement: j'utilise "autorégression" et "autorégressif" pour impliquer n'importe quelle structure de mémoire à une variable en général, indépendamment des propriétés à court terme, à long terme, racine unitaire, explosives, etc. de ce processus.


40

Une tentative de réponse.

L'autocorrélation n'est pas différente de toute autre relation entre les prédicteurs. C'est juste que le prédicteur et la variable dépendante se trouvent être la même série temporelle, juste décalée.

tous les états de l'univers ne dépendent-ils pas du précédent?

Oui en effet. Tout comme l'état de chaque objet dans l'univers dépend de tous les autres objets, via toutes sortes de forces physiques. La question est simplement de savoir si la relation est suffisamment forte pour être détectable ou suffisamment forte pour nous aider à prévoir les états.

Et la même chose s'applique à l'autocorrélation. C'est toujours là. La question est de savoir si nous devons le modéliser ou si le modéliser introduit simplement une incertitude supplémentaire (le compromis biais-variance), ce qui nous rend encore plus mal lotis que de ne pas le modéliser.


Un exemple de mon travail personnel: je prédis les ventes des supermarchés. La consommation de lait de mon ménage est assez régulière. Si je n'ai pas acheté de lait depuis trois ou quatre jours, il y a de fortes chances que j'arrive aujourd'hui ou demain pour acheter du lait. Si le supermarché veut prévoir la demande de lait de mon ménage , il doit absolument tenir compte de cette autocorrélation.

Cependant, je ne suis pas le seul client de mon supermarché. Il y a peut-être encore 2 000 ménages qui y achètent leurs produits alimentaires. La consommation de lait de chacun est à nouveau autocorrélée. Mais comme le taux de consommation de chacun est différent, l'autocorrélation globale est tellement atténuée qu'il n'est peut-être plus logique de la modéliser. Il a disparu dans la demande quotidienne générale, c'est-à-dire l'interception. Et comme le supermarché ne se soucie pas à qui il vend du lait, il modélisera la demande globale et n'inclura probablement pas l'autocorrélation.

(Oui, il y a une saisonnalité intra-hebdomadaire. Ce qui est une sorte d'autocorrélation, mais cela dépend vraiment du jour de la semaine, pas de la demande le même jour de semaine une semaine plus tôt, donc c'est plus un effet de jour de semaine que l'autocorrélation saisonnière. )


+1. Très bel exemple de la façon dont l'autocorrélation pourrait être diminuée dans l'ensemble. Tout comme un mélange de distributions peut se brouiller et confondre les choses. (Et j'ai toujours pensé que la prévision des ventes au détail serait un bon travail!)
Wayne

26
@Wayne: ça l'est. Je dis à mes enfants que papa s'assure qu'il y a toujours assez de crème glacée au supermarché. Je pense qu'ils m'aiment un peu plus à cause de mon travail.
S.Kolassa - Rétablir Monica le

8

Tout d'abord, je pense que vous voulez dire quel est le but d'évaluer l'autocorrélation et de la traiter. Si vous voulez vraiment dire le «but de l'autocorrélation», c'est la philosophie, pas les statistiques.

Deuxièmement, les états de l'univers sont corrélés avec les états précédents, mais tous les problèmes statistiques ne traitent pas des états de la nature antérieurs. De nombreuses études sont transversales.

Troisièmement, devons-nous le modéliser lorsqu'il est là? Les méthodes font des hypothèses. La plupart des formes de régression ne supposent aucune autocorrélation (c'est-à-dire que les erreurs sont indépendantes). Si nous violons cette hypothèse, nos résultats pourraient être erronés. Jusqu'où mal? Une façon de le dire serait de faire la régression habituelle et également un modèle qui tient compte de l'autocorrélation (par exemple, des modèles à plusieurs niveaux ou des méthodes de séries chronologiques) et de voir à quel point les résultats sont différents. Mais, je pense qu'en général, la prise en compte de l'auto-corrélation réduira le bruit et rendra le modèle plus précis.


2
"alors c'est la philosophie, pas les statistiques." Eh ... êtes-vous sûr de vouloir faire une distinction si nette? Après tout, les méthodologistes statistiques et les philosophes des sciences se préoccupent, par exemple, des distinctions entre la "prédiction" et l '"explication", d'une manière qui est pertinente pour le pourquoi et le comment des modèles autocorrélés.
Alexis
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.