Votre question liée concerne l'utilisation de pondérations comme raccourci pour traiter la variance par point de données pondérée de manière égale dans laquelle certains points de données se produisent plusieurs fois.
@whuber a abordé dans un commentaire la situation dans laquelle les variances de tous les points de données sont égales. Je vais donc aborder la situation dans laquelle ils ne sont pas égaux. C'est dans cette situation que la moyenne pondérée optimale produit une variance inférieure à la moyenne non pondérée, c'est-à-dire également pondérée.
La moyenne pondérée, en utilisant des poids wje, équivaut à Σni = 1wjeXje, et a une variance = Σni = 1w2jeVa r (Xje). Nous souhaitons donc minimiserΣni = 1w2jeVa r (Xje), sujet à Σni = 1wje= 1 et wje≥ 0 pour tous i.
Les conditions de Karush-Kuhn-Tucker, qui sont nécessaires et suffisantes pour un minimum global pour ce problème, étant donné qu'il s'agit d'un problème de programmation quadratique convexe, conduisent à une solution de forme fermée, à savoir:
L'optimale wje= [ 1 / Va r (Xje) ] /Σnj = 1[ 1 / Va r (Xj) ] pour 1 = 1 .. n.
La variance de la moyenne pondérée optimale correspondante = 1 /Σni = 1[ 1 / Va r (Xje) ].
En revanche, une pondération égale signifie wje=1npour tout i, où n est le nombre de points de données. Comme l'a souligné whuber, des poids égaux sont optimaux si toutes les variances de points de données sont égales, ce qui peut être vu à partir de la formule ci-dessuswje. Cependant, comme le montre cette formule, des poids égaux ne sont pas optimaux si les variances des points de données ne sont pas toutes égales, et entraînent en effet une variance plus grande (de la moyenne pondérée) que les poids optimaux. La variance de la moyenne pondérée de façon égale, c'est-à-dire la variance de la moyenne pondérée en utilisant des poids égaux =1n2Σni = 1Va r (Xje).
Voici quelques exemples de résultats numériques:
- Il y a deux points de données, ayant des variances respectivement de 1 et 4. La moyenne non pondérée a une variance = 1,25. La moyenne pondérée utilisant les poids optimaux de 0,8 et 0,2 respectivement, a une variance = 0,8, qui est bien sûr inférieure à 1,25.
- Il y a trois points de données, ayant des variances respectivement de 1, 4 et 9. La moyenne non pondérée a une variance = 1,5556. La moyenne pondérée utilisant les poids optimaux de 0,7347, 0,1837, 0,0816 respectivement, a une variance = 0,7347, qui est bien sûr inférieure à 1,5556.
Bien sûr, il est possible que la moyenne pondérée présente une variance plus grande que la moyenne non pondérée, si les poids sont mal choisis. En choisissant le poids de 1 sur le point de données présentant la plus grande variance et de 0 pour tous les autres points de données, la moyenne pondérée aurait la variance = la plus grande variance de tout point de données. Cet exemple extrême serait le résultat de la maximisation plutôt que de la minimisation du problème d'optimisation que j'ai exposé.