Étant donné la variable aléatoire
où sont des variables uniformes IID, comment calculer le PDF de ?
Étant donné la variable aléatoire
où sont des variables uniformes IID, comment calculer le PDF de ?
Réponses:
Il est possible que cette question soit un devoir, mais j’ai eu l’impression que cette question de probabilité élémentaire classique n’avait toujours pas de réponse complète au bout de plusieurs mois. Je vais donc vous en donner une ici.
De l'énoncé du problème, nous voulons la distribution de
où sont iid . Nous savons que si et seulement si chaque élément de l'échantillon est inférieur à . Puis, comme indiqué dans l’allusion de @varty, combiné au fait que les sont indépendants, nous permet de déduire
où est le CDF de la distribution uniforme . Donc le CDF de est
Puisque a une distribution absolument continue, nous pouvons déduire sa densité en différenciant le CDF . Donc la densité de est
Dans le cas particulier où , nous avons ce , qui est la densité d'une distribution bêta avec et , depuis .
Notez que la séquence que vous obtenez si vous devez trier votre échantillon par ordre croissant - - est appelée la statistique de l' ordre . Une généralisation de cette réponse est que toutes les statistiques d'ordre d'un échantillon distribué ont une distribution Bêta , comme indiqué dans la réponse de @ bnaul.
Le maximum d'un échantillon est l' un des statistiques d'ordre , et en particulier les ième statistique d'ordre de l'échantillon . En général, il est difficile de calculer la distribution des statistiques des commandes, comme le décrit l'article de Wikipedia; pour certaines distributions spéciales, les statistiques sur les ordres sont bien connues (par exemple, pour la distribution uniforme qui contient des statistiques sur les ordres distribués en mode bêta).
EDIT: L'article de Wikipedia sur les échantillons maximum et minimum est également utile et plus spécifique à votre problème.
Le maximum d'un ensemble de variables aléatoires IID, lorsqu'il est correctement normalisé, converge généralement vers l'un des trois types de valeurs extrêmes. C'est le théorème de Gnedenko, l'équivalence du théorème de la limite centrale pour les extrêmes. Le type dépend du comportement de la distribution de la population. Sachant cela, vous pouvez utiliser la distribution limite pour vous rapprocher de la distribution pour le maximum.
Puisque la distribution uniforme sur [a, b] est le sujet de cette question, Macro a donné la distribution exacte de n et donne une très bonne réponse. Le résultat est plutôt trivial. Pour la distribution normale, une belle forme fermée n'est pas possible, mais le maximum correspondant à la normale converge vers la distribution de Gumbel F (x) = exp (- e ) est normalisé de manière appropriée .
Pour l'uniforme, la normalisation est (ba) -x / n et F (bax / n) = (1-x / [n (ba)])
qui converge vers e . Notez ici que y = bax / n. et F (y) converge vers 1 lorsque y passe à ba. Ceci est valable pour tous les 0
Dans ce cas, il est facile de comparer la valeur exacte à sa limite asymptotique.