Je vais essayer de répondre à votre première question
Une marche aléatoire est une série de mesures dans lesquelles la valeur à un point donné de la série est la valeur du point précédent de la série plus une certaine quantité aléatoire.
Par exemple, supposons que vous lancez une pièce juste dans une série de lancers, et chaque fois que la pièce monte, vous ajoutez 1 à la valeur précédente de votre variable série, et chaque fois que la pièce arrive pile, vous soustrayez 1 de la valeur précédente. de votre variable série. Si la valeur de départ est 0 et si vous retournez la séquence suivante de lancers de pièces:
T H T T T H H H T T H T H T H
La marche aléatoire ,y sur la base de ces valeurs telles que décrites ci-dessus serait:
0 -1 0 -1 -2 -3 -2 -3 -1 -2 -2 -1 -2 -1 -2 -1
Donc, la valeur de y est:
yt=yt−1+2Bernoulli(0.5)–1
La distribution de dépend du temps , ce qui donne des propriétés intéressantes à un échantillon de à différents moments:yty
La moyenne de n'est pas définie. yCela peut sembler contre-intuitif, car vous pourriez vous attendre à ce que les têtes et les queues d'une pièce équilibrée soient centrées sur zéro. C'est vrai dans la mesure où cela va, mais zéro n'était qu'une valeur de départ arbitraire de . yIl n'y a donc pas de véritable moyen!
La variance de . y=tÀ mesure que le temps (le nombre de flips) augmente, la variance augmente également. Par exemple, au premier flip ( ), les valeurs possibles sont ou , et en effet la variance est alors 1. Mais au deuxième flip ( ) les valeurs possibles sont , ou , et la variance est égale à 2. Pour un nombre infini de flips (à , lorsque la plage de toutes les valeurs possibles de va de à ), la variance est infinie.t=11−1t=220−2t=∞y−∞∞
Ces deux faits font des ravages en essayant de tirer des inférences sur la distribution de (plutôt que pour un donné) étant donné seulement un échantillon lors de l'utilisation des outils de base de l'inférence statistique. (Comment un fini estimation non défini ? Comment un fini estimation ?)yyty0y¯s2yσ2y=∞
Il existe de nombreux types de marches aléatoires et, plus généralement, de processus autogrégressifs (c'est-à-dire toute variable qui dépend en quelque sorte de ses valeurs précédentes). L'exemple ici utilise une simple variable aléatoire de Bernouli (le tirage au sort), mais on pourrait:
- ajouter une valeur aléatoire normalement distribuée à des valeurs successives de place ... ou bien une valeur aléatoire tirée de toute sorte de distribution;y
- faire dépendre la valeur de à un moment donné des valeurs précédentes de à plusieurs moments (par exemple );yyyt=yt−1+yt−2+Something Random
- associer la valeur de à une valeur aléatoire de pour créer une marche aléatoire bidimensionnelle;yx
- faire de une fonction fantaisiste de , un exemple simple est , où , ce qui signifie que la mémoire de tout moment spécifique de se désintègre dans le temps (avec la mémoire qui dure plus longtemps est proche de 1) - selon les commentaires d'Alecos, ce serait simplement «autorégressif» (une marche aléatoire pure aurait );ytyt−1yt=αyt−1+Something Random|α|<1y |α||α|=1
- faire beaucoup d'autres choses pour rendre les marches aléatoires et / ou les processus autorégressifs plus complexes.
Mais ce sont tous les Dickens à essayer d'analyser en utilisant les méthodes de base. C'est pourquoi nous avons des régressions de cointégration et des modèles de correction d'erreurs et d'autres techniques d'analyse de séries chronologiques pour traiter ce type de données (que nous appelons parfois «non intégrées», «à mémoire longue» ou «racine unitaire» entre autres étiquettes). , selon les détails).
L'origine du terme "marche aléatoire" provient d'une paire de très brèves lettres à Nature en 1905.
Références
Pearson, K. (1905). Lettres à l'éditeur: Le problème de la marche aléatoire. Nature , 72 (1865): 294.
Pearson, K. (1905). Lettres à l'éditeur: Le problème de la marche aléatoire. Nature , 72 (1867): 342.