Si je donne deux quantiles et leurs emplacements correspondants (chacun) dans l'intervalle ouvert , puis-je toujours trouver les paramètres d'une distribution bêta qui a ces quantiles à les emplacements spécifiés?
Si je donne deux quantiles et leurs emplacements correspondants (chacun) dans l'intervalle ouvert , puis-je toujours trouver les paramètres d'une distribution bêta qui a ces quantiles à les emplacements spécifiés?
Réponses:
La réponse est oui, à condition que les données satisfassent à des exigences de cohérence évidentes. L'argument est simple, basé sur une construction simple, mais il nécessite une certaine configuration. Cela se résume à un fait intuitivement attrayant: l'augmentation du paramètre dans une distribution bêta augmente la valeur de sa densité (PDF) plus pour plus grand que plus petit ; et augmenter fait le contraire: plus est petit , plus la valeur du PDF augmente.
Les détails suivent.
Soit le quantile souhaité soit et le quantile souhaité soit avec et (donc) . Ensuite, il existe des et uniques pour lesquels la distribution bêta a ces quantiles.
La difficulté à démontrer cela est que la distribution bêta implique une constante de normalisation récalcitrante. Rappelons la définition: pour et , la distribution Beta a une fonction de densité (PDF)
La constante de normalisation est la fonction bêta
Tout devient compliqué si nous essayons de différencier directement par rapport à et , ce qui serait le moyen de force brute pour tenter une démonstration.
Une façon d'éviter d'avoir à analyser la fonction bêta est de noter que les quantiles sont des aires relatives . C'est,
pour . Voici, par exemple, le PDF et la fonction de distribution cumulative (CDF) d'un Beta de distribution pour lesquels et .
La fonction de densité est tracée à gauche. est l' aire sous la courbe à gauche de , indiquée en rouge, par rapport à l'aire totale sous la courbe. est l'aire à gauche de , égale à la somme des régions rouge et bleue, encore une fois par rapport à l'aire totale . Le CDF à droite montre comment et marquez deux points distincts dessus.
Sur cette figure, a été fixé à , a été choisi pour être de , et une valeur de a été trouvée pour laquelle se trouve sur le CDF bêta .
Lemme : Un tel peut toujours être trouvé.
Pour être précis, que soit fixé une fois pour toutes. (Ils restent les mêmes dans les illustrations qui suivent: dans les trois cas, l'aire relative à gauche de est égale à ) Pour tout , le lemme affirme qu'il existe une valeur unique de , écrite pour lequel est le quantile de la bêta Distribution.
Pour voir pourquoi, notons d'abord que lorsque approche de zéro, toute la probabilité s'accumule près des valeurs de , d'où approche . Lorsque approche de l'infini, toute la probabilité s'accumule près des valeurs de , d'où s'approche de . Entre les deux, la fonction augmente strictement en .
Cette affirmation est géométriquement évidente: cela revient à dire que si nous regardons l'aire à gauche sous la courbe rapport à l'aire totale sous la courbe et la comparons à la aire relative sous la courbe pour b ′ >b, alors cette dernière aire estrelativementplus grande. Le rapport de ces deux fonctions est ( 1 - x ) b ′ - b . Il s'agit d'une fonction égale à 1 lorsque x = 0 , passant régulièrement à 0 lorsque x = 1. Par conséquent, les hauteurs de la fonction sont relativement plus grandes que les hauteurs de pour à gauche de que pour à droite de Par conséquent, lazoneà gauche de dans le premier doit êtrerelativementplus grande que la zone à droite de (C'est simple à traduire en un argument rigoureux en utilisant une somme de Riemann, par exemple.)
Nous avons vu que la fonction est strictement croissante de façon monotone avec des valeurs limites à et en tant que et respectivement. Il est également (clairement) continu. Par conséquent, il existe un certain nombre où et ce nombre est unique, prouvant le lemme.
Le même argument montre qu'à mesure que augmente, l'aire à gauche de augmente. Par conséquent, les valeurs de varient sur un certain intervalle de nombres au fur et à mesure que progresse de presque à presque La limite de comme est
Voici un exemple où est proche de (il est égal à ). Avec et (comme dans la figure précédente), Il n'y a presque pas de zone entre et
Le CDF est pratiquement plat entre et où est pratiquement au-dessus de Dans la limite ,
À l'autre extrême, des valeurs suffisamment grandes d' plomb à arbitrairement proches de Voici un exemple avec comme précédemment.
Ici, et est près de Maintenant est essentiellement il n'y a presque pas d'aire à droite de
Par conséquent, vous pouvez sélectionner n'importe quel entre et et ajuster jusqu'à Tout comme auparavant, ce doit être unique,QED.
Le R
code de travail pour trouver des solutions est affiché à Déterminer les paramètres de distribution bêta et β à partir de deux points arbitraires (quantiles) .