Étant donné que le but ici est vraisemblablement d'obtenir une estimation valide et utile de , la distribution antérieure doit être cohérente avec la spécification de la distribution de la population dont provient l'échantillon. Cela ne signifie en aucune façon que nous «calculons» l'a priori en utilisant l'échantillon lui-même - cela annulerait la validité de la procédure entière. Nous savons que la population dont provient l'échantillon est une population de iid variables aléatoires uniformes, chacune comprise dans . Il s'agit d'une hypothèse maintenue et fait partie des informations antérieures que nous possédons (et cela n'a rien à voir avec l' échantillon , c'est-à-dire avec une réalisation spécifique d'un sous-ensemble de ces variables aléatoires).[ 0 , θ ]θ[0,θ]
Supposons maintenant que cette population se compose de variables aléatoires (alors que notre échantillon se compose de réalisations de variables aléatoires). L'hypothèse maintenue nous dit que
n < m n max i = 1 , . . . , N { X i } ≤ max j = 1 , . . . , m { X j } ≤ θmn<mn
maxi=1,...,n{Xi}≤maxj=1,...,m{Xj}≤θ
compacité . Ensuite, nous avons qui peut également s'écrire
θ ≥ X ∗ θ = c X ∗maxi=1,...,n{Xi}≡X∗θ≥X∗
θ=cX∗c≥1
La fonction de densité du des iid rv uniformes compris dans est
N [ 0 , θ ] f X ∗ ( x ∗ ) = N ( x ∗ ) N - 1maxN[0,θ]
fX∗(x∗)=N(x∗)N−1θN
pour le support , et zéro ailleurs. Ensuite, en utilisant et en appliquant la formule de changement de variable, nous obtenons une distribution préalable pour qui est cohérente avec l'hypothèse maintenue:
θ = c X ∗ θ f p ( θ ) = N ( θ[0,θ]θ=cX∗θ
fp(θ)=N(θc)N−1θN1c=NcNθ−1θ∈[x∗,∞]
ce qui peut être incorrect si nous ne spécifions pas la constante convenablement. Mais notre intérêt réside dans le fait d'avoir un postérieur approprié pour , et aussi, nous ne voulons pas restreindre les valeurs possibles de (au-delà de la restriction impliquée par l'hypothèse maintenue). On laisse donc indéterminé.
Puis en écrivant le postérieur estcθθc
X={x1,..,xn}
f(θ∣X)∝θ−NNcNθ−1⇒f(θ∣X)=ANcNθ−(N+1)
pour une constante de normalisation A. Nous voulons
∫Sθf(θ∣X)dθ=1⇒∫∞x∗ANcNθ−(N+1)dθ=1
⇒ANcN1−Nθ−N∣∣∞x∗=1⇒A=(cx∗)N
Insérer dans le postérieur
f(θ∣X)=(cx∗)NNcNθ−(N+1)=N(x∗)Nθ−(N+1)
Notez que la constante indéterminée de la distribution précédente s'est commodément annulée.c
Le postérieur résume toutes les informations que l'échantillon spécifique peut nous donner concernant la valeur de . Si nous voulons obtenir une valeur spécifique pour nous pouvons facilement calculer la valeur attendue de la partie postérieure,
θθ
E(θ∣X)=∫∞x∗θN(x∗)Nθ−(N+1)dθ=−NN−1(x∗)Nθ−N+1∣∣∞x∗=NN−1x∗
Y a-t-il une intuition dans ce résultat? Eh bien, à mesure que le nombre de augmente, le plus probable est que la réalisation maximale parmi eux sera de plus en plus proche de leur limite supérieure, - ce qui est exactement ce que reflète la valeur moyenne postérieure de : si, disons , , mais si . Cela montre que notre tactique concernant la sélection du prieur était raisonnable et cohérente avec le problème en question, mais pas nécessairement "optimale" dans un certain sens.θ θ N = 2 ⇒ E ( θ ∣ X ) = 2 x ∗ N = 10 ⇒ E ( θ ∣ X ) = 10XθθN=2⇒E(θ∣X)=2x∗N=10⇒E(θ∣X)=109x∗