MLE pour la distribution triangulaire?

Est-il possible d'appliquer la procédure MLE habituelle à la distribution triangulaire? - J'essaie mais je semble être bloqué à un moment ou à un autre dans les mathématiques par la façon dont la distribution est définie. J'essaie d'utiliser le fait que je connais le nombre d'échantillons au-dessus et au-dessous de c (sans connaître c): ces 2 nombres sont cn et (1-c) n, si n est le nombre total d'échantillons. Cependant, cela ne semble pas aider à la dérivation. Le moment des moments donne un estimateur pour c sans trop de problème. Quelle est la nature exacte de l'obstruction au MLE ici (s'il y en a effectivement un)?

Plus de détails:

Considérons dans et la distribution définie sur par: $c$ $[0,1]$ $[0,1]$

si x <c $f(x;c) = \frac{2x}{c}$
si c <= x $f(x;c) = \frac{2(1-x)}{(1-c)}$

Prenons un échantillon iid de cette distribution sous forme de log-vraisemblance de c étant donné cet échantillon: $n$ $\{x_{i}\}$

$\hat{l}(c | \{x_{i}\}) = \sum_{i=1}^{n}ln(f(x_{i}|c))$

J'essaie ensuite d'utiliser le fait que, étant donné la forme de , nous savons que échantillons tomberont en dessous de (inconnu) , et tombera au-dessus de . À mon humble avis, cela permet de décomposer la somme dans l'expression du log-vraisemblance ainsi: $f$ $cn$ $c$ $(1-c)n$ $c$

$\hat{l}(c | \{x_{i}\}) = \sum_{i=1}^{cn}ln\frac{2 x_{i}}{c} + \sum_{i=1}^{(1-c)n}ln\frac{2(1-x_{i})}{1-c}$

Ici, je ne sais pas comment procéder. MLE impliquera de prendre une dérivée par rapport à de la log-vraisemblance, mais j'ai comme limite supérieure de la somme, ce qui semble bloquer cela. Je pourrais essayer avec une autre forme de log-vraisemblance, en utilisant des fonctions d'indicateur: $c$ $c$

$\hat{l}(c | \{x_{i}\}) = \sum_{i=1}^{n}\{x_{i}<c\}ln\frac{2 x_{i}}{c} + \sum_{i=1}^{n}\{c<=x_{i}\}ln\frac{2(1-x_{i})}{1-c}$

Mais dériver les indicateurs ne semble pas facile non plus, bien que les deltas de Dirac pourraient permettre de continuer (tout en ayant des indicateurs, car nous devons dériver des produits).

Donc, ici, je suis bloqué dans MLE. Une idée?

— Franc
source

S'il s'agit d'un sujet, veuillez ajouter la balise d'auto-apprentissage. Si ce n'est pas le cas, veuillez expliquer comment le problème survient.

— Glen_b -Reinstate Monica

Merci pour la mise à jour; elle permet de dire beaucoup plus facilement des choses sensées en réponse, car elle réduit considérablement la portée des affaires à traiter. Pourriez-vous, s'il vous plaît, considérer mon commentaire précédent. Soit cela relève de l'auto-apprentissage, soit ce n'est pas le cas, dans les deux cas, j'ai demandé si vous feriez quelque chose.

— Glen_b -Reinstate Monica

Ce n'est pas pour un devoir ou un cours. Cela se pose à mon travail. Nous avons un autre estimateur à partir de la méthode des moments, mais j'essaie de mieux comprendre ce qui se passe avec MLE ici.

— Frank

D'accord; cela me donne plus de latitude. Voir ma réponse mise à jour. Je ferai probablement d'autres ajouts bientôt

— Glen_b -Reinstate Monica

Références / liens

— ajoutés

Est-il possible d'appliquer la procédure MLE habituelle à la distribution triangulaire?

Certainement! Bien qu'il y ait quelques bizarreries à gérer, il est possible de calculer les MLE dans ce cas.

Cependant, si par «la procédure habituelle» vous voulez dire «prenez des dérivées de la log-vraisemblance et fixez-la à zéro», alors peut-être pas.

Quelle est la nature exacte de l'obstruction au MLE ici (s'il y en a effectivement un)?

Avez-vous essayé de dessiner la probabilité?

Suivi après clarification de la question:

La question de dessiner la probabilité n'était pas un commentaire futile, mais centrale à la question.

MLE impliquera de prendre un dérivé

Non. MLE implique de trouver l'argmax d'une fonction. Cela implique seulement de trouver les zéros d'un dérivé sous certaines conditions ... qui ne tiennent pas ici. Au mieux, si vous parvenez à le faire, vous identifierez quelques minima locaux .

Comme ma question précédente le suggérait, regardez la probabilité.

$y$

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

$c$ probabilité de pic de triangulaire

log-vraisemblance pour le pic de triangulaire

Les lignes grises marquent les valeurs des données (j'aurais probablement dû générer un nouvel échantillon pour obtenir une meilleure séparation des valeurs). Les points noirs indiquent la vraisemblance / log-vraisemblance de ces valeurs.

Voici un zoom avant proche du maximum de la probabilité, pour voir plus de détails:

Détail de la probabilité

Comme vous pouvez le voir d'après la probabilité, dans de nombreuses statistiques d'ordres, la fonction de vraisemblance a des `` coins '' nets - des points où la dérivée n'existe pas (ce qui n'est pas surprenant - le pdf d'origine a un coin et nous prenons un produit de pdfs). Ceci (qu'il y a des cuspides aux statistiques de commande) est le cas avec la distribution triangulaire, et le maximum se produit toujours à l'une des statistiques de commande. (Le fait que les cuspides se produisent lors des statistiques d'ordre n'est pas unique aux distributions triangulaires; par exemple, la densité de Laplace a un coin et, par conséquent, la probabilité pour son centre en a un à chaque statistique d'ordre.)

Comme cela se produit dans mon échantillon, le maximum se produit comme la statistique du quatrième ordre, 0,3780912

$c$ $c$

Une référence utile est le chapitre 1 de " Beyond Beta " de Johan van Dorp et Samuel Kotz. En l'occurrence, le chapitre 1 est un chapitre «échantillon» gratuit pour le livre - vous pouvez le télécharger ici .

Il y a un joli petit papier par Eddie Oliver sur cette question avec la distribution triangulaire, je pense dans American Statistician (qui fait essentiellement les mêmes points; je pense que c'était dans un coin de l'enseignant). Si je parviens à le localiser, je le donnerai comme référence.

Edit: le voici:

EH Oliver (1972), A Maximum Likelihood Oddity,
The American Statistician , Vol 26, Issue 3, June, p43-44

( lien éditeur )

Si vous pouvez facilement vous en procurer, cela vaut le coup d'œil, mais ce chapitre Dorp et Kotz couvre la plupart des questions pertinentes, donc ce n'est pas crucial.

À titre de suivi de la question dans les commentaires - même si vous pouviez trouver un moyen de `` lisser '' les coins, vous auriez encore à faire face au fait que vous pouvez obtenir plusieurs maxima locaux:

deux max locaux

Il pourrait cependant être possible de trouver des estimateurs qui ont de très bonnes propriétés (meilleures que la méthode des moments), que vous pouvez écrire facilement. Mais ML sur le triangulaire sur (0,1) est quelques lignes de code.

S'il s'agit d'énormes quantités de données, cela aussi peut être traité, mais ce serait une autre question, je pense. Par exemple, tous les points de données ne peuvent pas être un maximum, ce qui réduit le travail, et d'autres économies peuvent être réalisées.

— Glen_b
source

Merci - je vais essayer de poster ma tentative ratée, en montrant de quelle distribution je parle exactement et où je pense que je suis bloqué.

— Frank

Merci pour l'explication détaillée! J'avais une autre idée cependant: supposons que je puisse trouver une famille de fonctions qui converge vers la distribution du triangle, mais ne serait pas par morceaux - pourrais-je l'utiliser pour dériver un MLE analytiquement, puis prendre la limite et supposer que j'aurais un MLE du la distribution du triangle elle-même?

— Frank

Peut-être - je pense que cela pourrait dépendre du processus limite particulier que vous utilisez ... et vous vous retrouverez probablement avec plusieurs maxima locaux, donc cela ne vous épargnera probablement que d'évaluer la probabilité près des statistiques d'ordre extrême de toute façon - mais même si cela travaillé, pourquoi voudriez-vous même essayer de faire quelque chose de si compliqué? Quel est le problème avec ML sur la distribution triangulaire? C'est vraiment assez simple à faire dans la pratique.

— Glen_b -Reinstate Monica

Je dois dire que ce MLE pour c basé sur les statistiques de commande est assez agréable, bien que la dérivation dans le chapitre ci-dessus prenne un peu de travail (pas trop difficile cependant) - belle illustration que l'essence de MLE est dans l'argmax (bien sûr!), plutôt que la dérivée (comme vous l'avez souligné, et je suis entièrement d'accord, il m'est venu à l'esprit de travailler en amont de l'étape dérivée "habituelle" (c'est-à-dire de simplement vous soucier de maximiser, par quelque moyen que ce soit), mais je n'ai pas poursuivi).

— Frank

x_{i}

$x_{i}$