Deux quantiles d'une distribution bêta déterminent-ils ses paramètres?


9

Si je donne deux quantiles (q1,q2) et leurs emplacements correspondants (l1,l2) (chacun) dans l'intervalle ouvert (0,1) , puis-je toujours trouver les paramètres d'une distribution bêta qui a ces quantiles à les emplacements spécifiés?


1
Non, contre-exemple de base (q1, q2) = (0,1) et (l1, l2) = (0,1), peu importe les paramètres.
Tim

1
@Tim Je pense que je vois votre point, mais votre contre-exemple ne remplit pas les conditions que j'ai spécifiées (par exemple que les emplacements sont dans l'intervalle ouvert ). (0,1)
Bota

1
Je pense que vous pouvez le faire numériquement (et qu'il y aura une solution unique), mais cela impliquerait un petit effort.
Glen_b -Reinstate Monica

1
Je pense aussi - la résolution numérique n'est pas difficile, mais il n'est pas facile de trouver un argument pour l'unicité.
Elvis

1
@Elvis en fait, je soupçonne qu'il pourrait y avoir un moyen de le faire en regardant les logits des deux variables (les OP et q ). lq
Glen_b -Reinstate Monica

Réponses:


9

La réponse est oui, à condition que les données satisfassent à des exigences de cohérence évidentes. L'argument est simple, basé sur une construction simple, mais il nécessite une certaine configuration. Cela se résume à un fait intuitivement attrayant: l'augmentation du paramètre a dans une distribution bêta (a,b) augmente la valeur de sa densité (PDF) plus pour x plus grand que x plus petit ; et augmenter b fait le contraire: plus x est petit , plus la valeur du PDF augmente.

Les détails suivent.


Soit le quantile q1 souhaité soit x1 et le quantile q2 souhaité soit x2 avec 1>q2>q1>0 et (donc) 1>x2>x1>0 . Ensuite, il existe des a et b uniques pour lesquels la distribution bêta (a,b) a ces quantiles.

La difficulté à démontrer cela est que la distribution bêta implique une constante de normalisation récalcitrante. Rappelons la définition: pour a>0 et b>0 , la distribution Beta (a,b) a une fonction de densité (PDF)

f(x;a,b)=1B(a,b)xa1(1x)b1.

La constante de normalisation est la fonction bêta

B(a,b)=01xa1(1x)b1dx=Γ(a)Γ(b)Γ(a+b).

Tout devient compliqué si nous essayons de différencier f(x;a,b) directement par rapport à a et b , ce qui serait le moyen de force brute pour tenter une démonstration.

Une façon d'éviter d'avoir à analyser la fonction bêta est de noter que les quantiles sont des aires relatives . C'est,

qi=F(xi;a,b)=0xif(x;a,b)dx01f(x;a,b)dx

pour i=1,2 . Voici, par exemple, le PDF et la fonction de distribution cumulative (CDF) F d'un Beta (1.15,0.57) de distribution pour lesquels x1=1/3 et q1=1/6 .

Figure 1

La fonction de densité xf(x;a,b) est tracée à gauche. q1 est l' aire sous la courbe à gauche de x1 , indiquée en rouge, par rapport à l'aire totale sous la courbe. q2 est l'aire à gauche de x2 , égale à la somme des régions rouge et bleue, encore une fois par rapport à l'aire totale . Le CDF à droite montre comment (x1,q1) et (x2,q2) marquez deux points distincts dessus.

Sur cette figure, (x1,q1) a été fixé à (1/3,1/6) , a a été choisi pour être de 1.15 , et une valeur de b a été trouvée pour laquelle (x1,q1) se trouve sur le CDF bêta (a,b) .

Lemme : Un tel b peut toujours être trouvé.

Pour être précis, que (x1,q1) soit fixé une fois pour toutes. (Ils restent les mêmes dans les illustrations qui suivent: dans les trois cas, l'aire relative à gauche de x1 est égale à q1 ) Pour tout a>0 , le lemme affirme qu'il existe une valeur unique de b , écrite b(a), pour lequel x1 est le quantile q1 de la bêta (a,b(a)) Distribution.

Pour voir pourquoi, notons d'abord que lorsque b approche de zéro, toute la probabilité s'accumule près des valeurs de 0 , d'où F(x1;a,b) approche 1 . Lorsque b approche de l'infini, toute la probabilité s'accumule près des valeurs de 1 , d'où F(x1;a,b) s'approche de 0 . Entre les deux, la fonction bF(x1;a,b)augmente strictement en b .

Cette affirmation est géométriquement évidente: cela revient à dire que si nous regardons l'aire à gauche sous la courbe xxa1(1x)b1 rapport à l'aire totale sous la courbe et la comparons à la aire relative sous la courbe xxa1(1x)b1 pour b >b, alors cette dernière aire estrelativementplus grande. Le rapport de ces deux fonctions est ( 1 - x ) b - b . Il s'agit d'une fonction égale à 1 lorsque x = 0 , passant régulièrement à 0 lorsque x = 1.b>b(1x)bb1x=0,0x=1. Par conséquent, les hauteurs de la fonction xf(x;a,b) sont relativement plus grandes que les hauteurs de xf(x;a,b) pour x à gauche dex1 que pourx à droite dex1. Par conséquent, lazoneà gauche dex1 dans le premier doit êtrerelativementplus grande que la zone à droite dex1. (C'est simple à traduire en un argument rigoureux en utilisant une somme de Riemann, par exemple.)

Nous avons vu que la fonction bf(x1;a,b) est strictement croissante de façon monotone avec des valeurs limites à 0 et 1 en tant que b0 et b, respectivement. Il est également (clairement) continu. Par conséquent, il existe un certain nombreb(a)f(x1;a,b(a))=q1 et ce nombre est unique, prouvant le lemme.

Le même argument montre qu'à mesure que b augmente, l'aire à gauche de x2 augmente. Par conséquent, les valeurs de f(x2;a,b(a)) varient sur un certain intervalle de nombres au fur et à mesure que a progresse de presque 0 à presque . La limite de f(x2;a,b(a)) commea0 estq1.

Voici un exemple où a est proche de 0 (il est égal à 0.1 ). Avec x1=1/3 et q1=1/6 (comme dans la figure précédente),b(a)0.02. Il n'y a presque pas de zone entrex1 etx2:

Figure 2

Le CDF est pratiquement plat entre x1 et x2,q2 est pratiquement au-dessus de q1. Dans la limite a0 , q2q1.

À l'autre extrême, des valeurs suffisamment grandes d' a plomb à F(x2;a,b(a)) arbitrairement proches de1. Voici un exemple avec(x1,q1) comme précédemment.

figure 3

Ici, a=8 et b(a) est près de 10. Maintenant F(x2;a,b(a)) est essentiellement 1: il n'y a presque pas d'aire à droite de x2.

Par conséquent, vous pouvez sélectionner n'importe quel q2 entre q1 et 1 et ajuster a jusqu'à F(x2;a,a(b))=q2. Tout comme auparavant, cea doit être unique,QED.


Le Rcode de travail pour trouver des solutions est affiché à Déterminer les paramètres de distribution bêta et β à partir de deux points arbitraires (quantiles)αβ .


Cette réponse montre que si nous avons choisi un ou un b fixe, nous trouverons une valeur correspondante unique. Il serait possible de construire des fonctions qui ont une zone fixe dans [ 0 , x 1 ] , [ x 1 , x 2 ] et [ x 2 , 1 ] . Je ne vois pas immédiatement pourquoi cela garantirait que l'ensemble de α et β est unique. Seriez-vous prêt à m'élaborer et à m'éclairer? ab[0,x1][x1,x2][x2,1]αβ
janvier

@Jan Pourriez-vous expliquer ce que vous entendez par "ensemble de et β "? Ces symboles n'apparaissent nulle part dans ce fil. αβ
whuber
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.