La trinité des tests en toute vraisemblance: que faire face à des conclusions contradictoires?


10

Les tests de Wald, de rapport de vraisemblance et de multiplicateur de Lagrange dans le contexte de l'estimation du maximum de vraisemblance sont asymptotiquement équivalents. Cependant, pour les petits échantillons, ils ont tendance à diverger un peu, et dans certains cas, ils aboutissent à des conclusions différentes.

Comment peuvent-ils être classés en fonction de leur probabilité de rejeter le nul? Que faire lorsque les tests ont des réponses contradictoires? Pouvez-vous simplement choisir celle qui donne la réponse que vous souhaitez ou existe-t-il une "règle" ou une "directive" sur la façon de procéder?


est-ce peut-être juste un cas où les approximations asymptotiques des distributions [nulles] d'une ou plusieurs des trois statistiques de test ne sont pas si bonnes? peut-être que les résultats diffèrent parce que les tailles réelles des tests sont différentes? quelle est la taille de vos échantillons?
ronaf

Réponses:


5

Je ne connais pas assez bien la littérature dans le domaine pour offrir une réponse directe. Cependant, il me semble que si les trois tests diffèrent, cela indique que vous avez besoin de plus de recherches / collecte de données afin de répondre définitivement à votre question.

Vous pouvez également consulter cette recherche Google Scholar

Mise à jour en réponse à votre commentaire:

Si la collecte de données supplémentaires n'est pas possible, il existe une solution de contournement. Faites une simulation qui reflète votre structure de données, la taille de l'échantillon et votre modèle proposé. Vous pouvez définir les paramètres sur certaines valeurs prédéfinies. Estimez le modèle à l'aide des données générées, puis vérifiez lequel des trois tests vous indique le bon modèle. Une telle simulation offrirait des indications sur le test à utiliser pour vos données réelles. Cela a-t-il du sens?


1
Faites-vous référence à un document particulier? J'imagine que je pourrais trouver une réponse à ma question si j'ai fait des recherches, étudié, lu beaucoup, mais 95% des questions que d'autres pourraient poser ici aussi ... Dans certains cas, en particulier avec les données macroéconomiques (qui sont mon domaine) ), il n'y a plus de données à collecter. Les données sont rares (le nombre d'observations, je veux dire), et il suffit de vivre avec. Il n'y a pas de solution "obtenir plus de données". J'espérais que quelqu'un ici connaîtrait le sujet, mais cela ne semble pas. Peut-être une fois le site ouvert au grand public?
Vivi

Je soupçonne que la réponse à votre question sera spécifique au domaine / modèle et je ne suis donc pas sûr de pouvoir recommander un document spécifique.

1
Désolé pour la réponse tardive. J'aime votre suggestion de simulation. Mais ce n'est pas vraiment facile. La vérité est que ce que je vois dans la pratique, c'est que les chercheurs font simplement le test qui est plus facile à calculer ou qui leur donne le résultat qu'ils souhaitent.
Vivi

8

Je ne donnerai pas de réponse définitive en termes de classement des trois. Créez des IC à 95% autour de vos paramètres en fonction de chacun, et s'ils sont radicalement différents, alors votre première étape devrait être de creuser plus profondément. Transformez vos données (bien que le LR soit invariant), régularisez votre probabilité, etc. Dans un pincement cependant, j'opterais probablement pour le test LR et l'IC associé. Un argument approximatif suit.

Le LR est invariant sous le choix de la paramétrisation (par exemple T contre logit (T)). La statistique de Wald suppose une normalité de (T - T0) / SE (T). Si cela échoue, votre CI est mauvais. La bonne chose à propos du LR est que vous n'avez pas besoin de trouver une transformée f (T) pour satisfaire la normalité. L'IC à 95% basé sur T sera le même. De plus, si votre probabilité n'est pas quadratique, l'IC à 95% de Wald, qui est symétrique, peut être bizarre car il peut préférer des valeurs avec une probabilité plus faible à celles avec une probabilité plus élevée.

Une autre façon de penser le LR est qu'il utilise plus d'informations, en gros, de la fonction de vraisemblance. Le Wald est basé sur le MLE et la courbure de la probabilité nulle. Le score est basé sur la pente à zéro et la courbure à zéro. Le LR évalue la probabilité sous le nul et la probabilité sous l'union du nul et de l'alternative, et combine les deux. Si vous êtes obligé d'en choisir un, cela peut être intuitivement satisfaisant pour choisir le LR.

Gardez à l'esprit qu'il existe d'autres raisons, telles que la commodité ou le calcul, d'opter pour Wald ou Score. Le Wald est le plus simple et, étant donné un paramètre multivarié, si vous testez pour définir de nombreux paramètres individuels à 0, il existe des moyens pratiques d'estimer la probabilité. Ou si vous souhaitez ajouter une variable à la fois à partir d'un ensemble, vous ne souhaiterez peut-être pas maximiser la probabilité pour chaque nouveau modèle, et la mise en œuvre des tests de score offre une certaine commodité ici. Le Wald et le Score deviennent attrayants à mesure que vos modèles et vos chances deviennent peu attrayants. (Mais je ne pense pas que c'est ce que vous interrogiez, car vous avez les trois disponibles ...)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.