Même moyenne, variance différente

Supposons que huit coureurs participent à une course; la distribution de leurs temps d'exécution individuels est normale et chacun a une moyenne de secondes, par exemple. L'écart type du coureur un est le plus petit, deux le deuxième plus petit, le troisième le plus petit, etc., et huit le plus grand. Deux questions me déroutent: (1) Quelle est la probabilité que le premier bat le dernier et (2) qui est le plus susceptible de gagner la course? $11$

Mes réponses sont et , respectivement. Puisqu'ils partagent la même moyenne, la probabilité que soit juste , non? Comment puis-je démontrer la deuxième partie de façon rigoureuse et peut-on calculer une probabilité exacte de gagner? Merci d'avance. $1/2$ $8$ $\bar x_1-\bar x_8\lt 0$ $1/2$

— George Tedder
source

@Silverfish En comparant le premier (modélisé comme la variable aléatoire ) au dernier ( , supposé indépendant de ), il suffit de considérer . Cela a une distribution continue symétrique avec une moyenne nulle. La chance que le premier bat en dernier est la chance que , qui (par symétrie et continuité) soit égal à comme revendiqué. Bien que le dernier ait plus de chances de gagner la course, il n'y a pas de paradoxe: la plupart du temps, lorsque les premiers battements durent, quelqu'un d'autre gagnera la course.

X_{1}

$X_1$

X_{n}

$X_n$

X_{1}

$X_1$

Z = X_{1} - X_{n}

$Z=X_1-X_n$

Z < 0

$Z\lt 0$

1 / 2

$1/2$

— whuber

@whuber Merci, j'ai réussi à déformer ce que je voulais dire - à supprimer pour éviter toute confusion. Le chiffre de 1/2 est correct, mais la réponse pour comparer leurs temps moyens est incorrecte et semble inviter à la confusion avec les moyennes de population. Au moment où vous écrivez, cela devrait être la différence dans le .

\bar{x_{i}}

$\bar{x_i}$

X_{i}

$X_i$

— Silverfish

@Silver Cela met en évidence le danger de supposer que nous savons toujours ce que signifie la notation de quelqu'un, simplement parce qu'elle semble familière. J'ai ignoré ce problème (avec des surlignages apparaissant sur " " et " ") parce que la signification voulue était suffisamment claire et impliquait qu'aucun d'eux ne pouvait éventuellement représenter la moyenne de quoi que ce soit: dans ce contexte, ils doivent représenter les variables aléatoires eux-mêmes (que j'ai écrit et ).

x_{1}

$x_1$

x_{8}

$x_8$

X_{1}

$X_1$

X_{n}

$X_n$

— whuber

Bien qu'une probabilité exacte ne puisse pas être calculée (sauf dans des circonstances spéciales avec ), elle peut être calculée numériquement rapidement avec une grande précision. Malgré cette limitation, il peut être rigoureusement prouvé que le coureur avec le plus grand écart-type a la plus grande chance de gagner. La figure illustre la situation et montre pourquoi ce résultat est intuitivement évident: $n \le 2$

Les densités de probabilité pour les temps de cinq coureurs sont indiquées. Tous sont continus et symétriques par rapport à une moyenne commune . (Des densités bêta à l'échelle ont été utilisées pour garantir que tous les temps sont positifs.) Une densité, dessinée en bleu foncé, a une propagation beaucoup plus grande. La partie visible de sa queue gauche représente des temps qu'aucun autre coureur ne peut généralement égaler. Parce que cette queue gauche, avec sa surface relativement grande, représente une probabilité appréciable, le coureur avec cette densité a la plus grande chance de gagner la course. (Ils ont également la plus grande chance de venir en dernier!) $\mu$

Ces résultats sont prouvés pour plus que des distributions normales: les méthodes présentées ici s'appliquent également aux distributions symétriques et continues. (Cela intéressera toute personne qui s'oppose à l'utilisation de distributions normales pour modéliser les temps d'exécution.) Lorsque ces hypothèses sont violées, il est possible que le coureur avec le plus grand écart-type n'ait pas la plus grande chance de gagner (je laisse la construction de contre-exemples à lecteurs intéressés), mais nous pouvons toujours prouver sous des hypothèses plus douces que le coureur avec le plus grand SD aura les meilleures chances de gagner à condition que SD soit suffisamment grand.

La figure suggère également que les mêmes résultats pourraient être obtenus en considérant les analogues unilatéraux de l'écart type (la soi-disant "semi-variance"), qui mesurent la dispersion d'une distribution d'un côté seulement. Un coureur avec une grande dispersion vers la gauche (vers des temps meilleurs) devrait avoir une plus grande chance de gagner, indépendamment de ce qui se passe dans le reste de la distribution. Ces considérations nous aident à apprécier en quoi la propriété d' être le meilleur (dans un groupe) diffère d'autres propriétés telles que les moyennes.

Soit des variables aléatoires représentant les temps des coureurs. La question suppose qu'ils sont indépendants et normalement distribués avec une moyenne commune . (Bien que ce soit littéralement un modèle impossible, car il présente des probabilités positives pour des temps négatifs, il peut toujours être une approximation raisonnable de la réalité à condition que les écarts-types soient sensiblement inférieurs à .) $X_1, \ldots, X_n$ $\mu$ $\mu$

Pour mener à bien l'argument suivant, retenons la supposition d'indépendance mais supposons autrement que les distributions des sont données par et que ces lois de distribution peuvent être n'importe quoi. Pour plus de commodité, supposons également que la distribution soit continue avec la densité . Plus tard, au besoin, nous pouvons appliquer des hypothèses supplémentaires à condition qu'elles incluent le cas des distributions normales. $X_i$ $F_i$ $F_n$ $f_n$

Pour tout et infinitésimal , la chance que le dernier coureur ait un temps dans l'intervalle et soit le coureur le plus rapide est obtenue en multipliant toutes les probabilités pertinentes (car tous les temps sont indépendants): $y$ $dy$ $(y-dy, y]$

Pr (X_{n} \in (y - d y, y], X_{1} > y, \dots, X_{n - 1} > y) = f_{n} (y) d y (1 - F_{1} (y)) \dots (1 - F_{n - 1} (y)) .

$\Pr(X_n \in (y-dy, y], X_1 \gt y, \ldots, X_{n-1} \gt y) = f_n(y)dy(1-F_{1}(y))\cdots(1-F_{n-1}(y)).$

L'intégration sur toutes ces possibilités mutuellement exclusives donne

Pr (X_{n} \leq min (X_{1}, X_{2}, \dots, X_{n - 1})) = \int_{R} f_{n} (y) (1 - F_{1} (y)) \dots (1 - F_{n - 1} (y)) d y .

$\Pr(X_n \le \min(X_1, X_2, \ldots, X_{n-1})) = \int_{\mathbb R} f_n(y)(1-F_1(y))\cdots(1-F_{n-1}(y)) dy.$

Pour les distributions normales, cette intégrale ne peut pas être évaluée sous forme fermée lorsque : elle nécessite une évaluation numérique. $n\gt 2$

Cette figure représente l'intégrale pour chacun des cinq coureurs ayant des écarts-types dans le rapport 1: 2: 3: 4: 5. Plus le SD est grand, plus la fonction est décalée vers la gauche - et plus sa zone est grande. Les zones sont d'environ 8: 14: 21: 26: 31%. En particulier, le coureur avec le plus grand écart-type a 31% de chances de gagner.

Bien qu'une forme fermée ne puisse pas être trouvée, nous pouvons toujours tirer des conclusions solides et prouver que le coureur avec le plus grand SD est le plus susceptible de gagner. Nous devons étudier ce qui se passe lorsque l'écart-type de l'une des distributions, disons , change. Lorsque la variable aléatoire est redimensionnée par autour de sa moyenne, sa SD est multipliée par et changera en $F_n$ $X_n$ $\sigma \gt 0$ $\sigma$ $f_n(y)dy$ $f_n(y/\sigma)dy/\sigma$ . Faire le changement de la variable dans l'intégrale donne une expression pour la chance de gagner coureur , en fonction de : $y=x\sigma$ $n$ $\sigma$

ϕ (σ) = \int_{R} f_{n} (y) (1 - F_{1} (y σ)) \dots (1 - F_{n - 1} (y σ)) d y .

$\phi(\sigma) = \int_{\mathbb R} f_n(y)(1-F_1(y\sigma))\cdots(1-F_{n-1}(y\sigma)) dy.$

Supposons maintenant que les médianes de toutes les distributions soient égales et que toutes les distributions soient symétriques et continues, avec des densités . (C'est certainement le cas dans les conditions de la question, car une médiane normale est sa moyenne.) Par un simple changement (de localisation) de variable, nous pouvons supposer que cette médiane commune est ; la symétrie signifie et $n$ $f_i$ $0$ $f_n(y) = f_n(-y)$ pour tous les . Ces relations nous permettent de combiner l'intégrale sur avec l'intégrale sur pour donner $1 - F_j(-y) = F_j(y)$ $y$ $(-\infty, 0]$ $(0,\infty)$

ϕ (σ) = \int_{0}^{\infty} f_{n} (y) (\prod_{j = 1}^{n - 1} (1 - F_{j} (y σ)) + \prod_{j = 1}^{n - 1} F_{j} (y σ)) d y .

$\phi(\sigma) = \int_0^{\infty} f_n(y)\left(\prod_{j=1}^{n-1}\left(1-F_j(y\sigma)\right)+\prod_{j=1}^{n-1}F_j(y\sigma)\right) dy.$

La fonction est différenciable. Sa dérivée, obtenue en différenciant l'intégrande, est une somme d'intégrales où chaque terme est de la forme $\phi$

y f_{n} (y) f_{i} (y σ) (\prod_{j \neq i}^{n - 1} F_{j} (y σ) - \prod_{j \neq i}^{n - 1} (1 - F_{j} (y σ)))

$y f_n(y) f_i(y\sigma)\left(\prod_{j\ne i}^{n-1}F_j(y\sigma) - \prod_{j\ne i}^{n-1}(1-F_j(y\sigma))\right)$

pour . $i=1, 2, \ldots, n-1$

Les hypothèses que nous avons faites sur les distributions ont été conçues pour garantir que pour . Ainsi, puisque , chaque terme dans le produit de gauche dépasse son terme correspondant dans le produit de droite, ce qui implique que la différence de produits n'est pas négative. Les autres facteurs sont clairement non négatifs car les densités ne peuvent pas être négatives et $F_j(x) \ge 1-F_j(x)$ $x\ge 0$ $x=y\sigma\ge 0$ $y f_n(y) f_i(y\sigma)$ . On peut conclure que pour , prouvant quela chance que le joueur gagne augmente avec l'écart type de . $y\ge 0$ $\phi^\prime(\sigma) \ge 0$ $\sigma \ge 0$ $n$ $X_n$

Cela suffit pour prouver que le coureur gagnera à condition que l'écart-type de soit suffisamment grand. Ce n'est pas tout à fait satisfaisant, car un écart-type important pourrait entraîner un modèle physiquement irréaliste (où les temps de victoire négatifs ont des chances appréciables). Mais supposons que toutes les distributions aient des formes identiques en dehors de leurs écarts-types . Dans ce cas, quand ils ont tous la même SD, les sont indépendants et identiques: personne ne peut avoir plus ou moins de chances de gagner que quiconque, donc toutes les chances sont égales (à ). Commencez par définir toutes les distributions sur celle du coureur $n$ $X_n$ $X_i$ $1/n$ $n$ . Maintenant, diminuez progressivement les SD de tous les autres coureurs, un à la fois. Dans ce cas, les chances que gagne ne peuvent pas diminuer, tandis que les chances de tous les autres coureurs ont diminué. Par conséquent, a les plus grandes chances de gagner, QED . $n$ $n$

— whuber
source

@ Phonon C'est vrai. (Mais veuillez ne pas confondre les distributions avec des estimations dérivées d'échantillons. La distribution est un modèle mathématique, pas un ensemble de données.) L'augmentation de l'écart-type d'un facteur

, par exemple, étire uniformément l'axe horizontal. Parce que (par la loi de probabilité totale) la fonction de densité couvrira une zone unitaire, cet étirement doit être compensé par un étirement de l'axe vertical de

, préservant ainsi toutes les zones. Ainsi, des SD plus petits correspondent à des pics plus hauts et des SD plus grands à des pics plus courts.

λ

$\lambda$

1 / λ

$1/\lambda$

— whuber

Merci beaucoup pour votre réponse, est parfaitement logique. La connaissance des valeurs de pointe seules dans ce sens est donc assez importante.

— Phonon