- Quelle est la propriété oracle d'un estimateur?
- Pour quels objectifs de modélisation la propriété oracle est-elle pertinente (prédictive, explicative, ...)?
Des explications théoriquement rigoureuses et (surtout) intuitives sont les bienvenues.
Des explications théoriquement rigoureuses et (surtout) intuitives sont les bienvenues.
Réponses:
Un oracle connaît la vérité: il connaît le vrai sous-ensemble et est disposé à agir en conséquence. La propriété oracle est que la distribution asymptotique de l'estimateur est la même que la distribution asymptotique du MLE sur le support réel uniquement. Autrement dit, l'estimateur s'adapte pour connaître le véritable support sans payer de prix (en termes de distribution asymptotique.)
Par les propriétés d'optimalité asymptotique du MLE discutées, par exemple, dans les statistiques théoriques de Keener dans le théorème 9.14, nous savons, dans certaines conditions techniques qui tiennent lorsque, par exemple, l'erreur est gaussienne, que oùon suppose queβ * S est le coefficient vrai sur le véritable supportS. Notez que la variance de la distribution asymptotique est l'inverse de l'informationFisher, montrant que β Sest asymptotiquement efficace. Étant donné que le MLE connaissant le véritable support y parvient, il est également requis dans le cadre de la propriété oracle.
Cependant, nous payons un prix élevé non asymptotique: voir, par exemple,
Hannes Leeb, Benedikt M. Pötscher, Sparse estimators and the oracle property, or the return of Hodges 'estimator, Journal of Econometrics, Volume 142, Issue 1, 2008, Pages 201-211,
ce qui montre que le risque de tout «estimateur d'oracle» (au sens de Fan et Li, 2001) a un supremum qui diverge à l'infini.
La définition de la propriété Oracle est étroitement liée au contexte. La réponse très courte mais précise en régression linéaire (précisément de haute dimension) est la suivante:
un estimateur Oracle doit être cohérent dans l'estimation des paramètres et la sélection des variables.
Notez qu'un estimateur cohérent dans la sélection des variables n'est pas nécessairement cohérent dans l'estimation des paramètres. Voir le papier lasso adaptatif pour les définitions mathématiques ou simplement voir ces diapositives .