Quelle est la variance du produit de variables aléatoires corrélées?
Quelle est la variance du produit de variables aléatoires corrélées?
Réponses:
Plus d'informations sur ce sujet que vous n'en avez probablement besoin peuvent être trouvées dans Goodman (1962): "The Variance of the Product of K Random Variables" , qui dérive des formules pour les variables aléatoires indépendantes et les variables aléatoires potentiellement corrélées, ainsi que quelques approximations. Dans un article précédent ( Goodman, 1960 ), la formule pour le produit d'exactement deux variables aléatoires a été dérivée, ce qui est un peu plus simple (bien que toujours assez noueux), ce qui pourrait être un meilleur endroit pour commencer si vous voulez comprendre la dérivation .
Pour être complet, cependant, cela se passe comme ceci.
Supposons ce qui suit:
Alors: ou équivalent:
L'article de 1960 suggère qu'il s'agit d'un exercice pour le lecteur (qui semble avoir motivé l'article de 1962!).
La notation est similaire, avec quelques extensions:
Puis enfin:
Voir les papiers pour plus de détails et des approximations légèrement plus maniables!
Juste pour ajouter à la réponse impressionnante de Matt Krause (en fait facilement dérivable de là). Si x, y sont indépendants, alors,
En plus de la formule générale donnée par Matt, il convient de noter qu'il existe une formule un peu plus explicite pour les variables aléatoires gaussiennes moyennes nulles. Il découle du théorème d' Isserlis , voir aussi Moments supérieurs pour la distribution normale multivariée centrée.
Supposons que suit une distribution normale multivariée avec une moyenne de 0 et une matrice de covariance . Si le nombre de variables est impair,
et
où signifie la somme de toutes les partitions de en paires disjointes chaque terme étant un produit des , et où
Σ k E ( ∏ i x i ) = 0 V ( ∏ i ˜ Σ i , j ˜ Σ = ( Σ Σ Σ Σ ) ( x 1 , … , V ( x 1 x 2 ) = Σ 1 , 1 Σ
Il est en effet possible de mettre en œuvre la formule générale. La partie la plus difficile semble être le calcul des partitions requises. Dans R, cela peut être fait avec la fonction setparts
du package partitions
. En utilisant ce package, il n'a pas été difficile de générer les 2 027 025 partitions pour , les 34 459 425 partitions pour également pu être générées, mais pas les 654 729 075 partitions pour (sur mon ordinateur portable de 16 Go).k = 9 k = 10
Deux autres choses méritent d'être notées. Premièrement, pour les variables gaussiennes avec une moyenne non nulle, il devrait être possible de dériver une expression également à partir du théorème d'Isserlis. Deuxièmement, il n'est pas clair (pour moi) si la formule ci-dessus est robuste contre les écarts par rapport à la normalité, c'est-à-dire si elle peut être utilisée comme approximation même si les variables ne sont pas multivariées normalement distribuées. Troisièmement, bien que les formules ci-dessus soient correctes, on peut se demander dans quelle mesure la variance indique la distribution des produits. Même pour la distribution du produit est assez leptokurtic, et pour plus grand, il devient rapidement extrêmement leptokurtic.k