"Qu'est-ce qui fait que l'estimateur fonctionne lorsque la distribution d'erreur réelle ne correspond pas à la distribution d'erreur supposée?"
En principe, le QMPLE ne pas « travail », au sens d'être un estimateur « bon ». La théorie développée autour du QMLE est utile car elle a conduit à des tests de mauvaise spécification.
Ce que le QMLE fait certainement, c'est d'estimer de manière cohérente le vecteur de paramètre qui minimise la divergence de Kullback-Leiber entre la vraie distribution et celle spécifiée. Cela semble bien, mais minimiser cette distance ne signifie pas que la distance minimisée ne sera pas énorme.
Pourtant, nous lisons qu'il existe de nombreuses situations où le QMLE est un estimateur cohérent pour le vrai vecteur de paramètre. Cela doit être évalué au cas par cas, mais permettez-moi de donner une situation très générale, qui montre qu'il n'y a rien inhérent au QMLE qui le rend cohérent pour le vrai vecteur ...
... C'est plutôt le fait que qu'il coïncide avec un autre estimateur qui est toujours cohérent (en maintenant l'hypothèse ergodic-stationnaire de l'échantillon): l'ancien, l'estimateur de la méthode des moments.
En d'autres termes, en cas de doute sur la distribution, une stratégie à considérer est de «toujours spécifier une distribution pour laquelle l'estimateur du maximum de vraisemblance pour les paramètres d'intérêt coïncide avec l'estimateur de la méthode des moments» : de cette manière, peu importe la distance est votre hypothèse de distribution, l'estimateur sera au moins cohérent.
Vous pouvez prendre cette stratégie à des extrêmes ridicules: supposez que vous avez un très grand échantillon iid d'une variable aléatoire, où toutes les valeurs sont positives. Continuez et supposez que la variable aléatoire est normalement distribuée et appliquez le maximum de vraisemblance pour la moyenne et la variance: votre QMLE sera cohérent pour les vraies valeurs.
Bien sûr, cela soulève la question de savoir pourquoi prétendre appliquer la MLE, car ce que nous faisons essentiellement, c'est de nous appuyer et de nous cacher derrière les forces de Method of Moments (qui garantit également une normalité asymptotique)?
Dans d'autres cas plus raffinés, QMLE peut se révéler cohérent pour les paramètres d'intérêt si nous pouvons dire que nous avons correctement spécifié la fonction moyenne conditionnelle mais pas la distribution (c'est par exemple le cas pour le Pooled Poisson QMLE - voir Wooldridge) .