Beaucoup de gens (en dehors des experts) qui se croient fréquentistes sont en fait bayésiens. Cela rend le débat un peu inutile. Je pense que le bayésianisme a gagné, mais qu'il y a encore beaucoup de bayésiens qui se croient fréquentistes. Il y a des gens qui pensent qu'ils n'utilisent pas de prieurés et qui sont donc fréquentistes. C'est une logique dangereuse. Il ne s’agit pas tant de priors (prieurs uniformes ou non uniformes), la vraie différence est plus subtile.
(Je ne suis pas officiellement au département de statistique; je possède une formation en maths et en informatique. J'écris en raison des difficultés que j'ai eues pour essayer de discuter de ce "débat" avec d'autres non-statisticiens, et même avec certains débuts de carrière. statisticiens.)
Le MLE est en réalité une méthode bayésienne. Certaines personnes diront "Je suis un fréquentiste parce que j'utilise le MLE pour estimer mes paramètres". J'ai vu cela dans la littérature évaluée par les pairs. Cela n'a aucun sens et est basé sur ce mythe (non dit, mais implicite) selon lequel un fréquentiste est quelqu'un qui utilise un préalable uniforme au lieu d'un précédent non uniforme).
μ = 0θ
X≡ N( μ = 0 , σ2= θ )
Considérons maintenant la fonction de vraisemblance. Cette fonction a deuxXθθX
F( x , θ ) = Pσ2= θ( X= x ) = 12 πθ√e- x22 θ
Xθ
θθX
Cette distinction entre les tranches horizontales et verticales est cruciale et j’ai trouvé que cette analogie m’a aidé à comprendre l’approche fréquentiste du biais .
Un bayésien est quelqu'un qui dit
θF( x , θ )
g( θ )
θF( x , θ ) g( θ )
Ainsi, un bayésien fixe x et examine la tranche verticale correspondante dans ce tracé de contour (ou dans le tracé de variante incorporant le précédent). Dans cette tranche, l'aire sous la courbe n'a pas besoin d'être égale à 1 (comme je l'ai dit précédemment). Un intervalle de confiance (IC) bayésien à 95% est l'intervalle qui contient 95% de la surface disponible. Par exemple, si la zone est 2, la zone située sous l'IC Bayesien doit être de 1,9.
θ
θ
N( μ = 0 , σ2= θ )θX- 3 θ√+ 3 θ√
θ
Ce n'est pas la seule façon de construire le CI fréquentiste, ce n'est même pas un bon (étroit), mais supportez-moi un instant.
La meilleure façon d'interpréter le mot «intervalle» ne consiste pas en un intervalle sur une ligne à un jour, mais à le considérer comme une zone située dans le plan à deux dimensions ci-dessus. Un "intervalle" est un sous-ensemble du plan 2D, et non d'une ligne 1D. Si quelqu'un propose un tel «intervalle», nous devons alors vérifier s'il est valide à un niveau de confiance / crédible de 95%.
Un fréquentiste vérifiera la validité de cet «intervalle» en considérant chaque tranche horizontale à tour de rôle et en examinant l'aire sous la courbe. Comme je l'ai dit précédemment, la zone sous cette courbe sera toujours une. La condition essentielle est que la zone comprise dans cet "intervalle" soit au moins égale à 0,95.
Un bayésien vérifiera la validité en regardant plutôt les tranches verticales. Là encore, l'aire sous la courbe sera comparée à la sous-zone située sous l'intervalle. Si cette dernière correspond à au moins 95% de la première, l'intervalle est un intervalle crédible bayésien valide à 95%.
Maintenant que nous savons comment vérifier si un intervalle particulier est «valide», la question est de savoir comment choisir la meilleure option parmi les options valides. Cela peut être un art noir, mais généralement vous voulez l'intervalle le plus étroit. Les deux approches tendent à s'accorder ici - les tranches verticales sont prises en compte et l'objectif est de rendre l'intervalle le plus étroit possible à l'intérieur de chaque tranche verticale.
Je n'ai pas tenté de définir l'intervalle de confiance fréquentiste le plus étroit possible dans l'exemple ci-dessus. Voir les commentaires de @ cardinal ci-dessous pour des exemples d'intervalles plus étroits. Mon objectif n'est pas de trouver les meilleurs intervalles, mais d'insister sur la différence entre les tranches horizontale et verticale pour déterminer la validité. Un intervalle qui satisfait les conditions d'un intervalle de confiance fréquentiste à 95% ne satisfait généralement pas les conditions d'un intervalle crédible bayésien à 95%, et inversement.
Les deux approches souhaitent des intervalles étroits, c'est-à-dire que lorsque l'on considère une tranche verticale, on souhaite que l'intervalle (1-d) de cette tranche soit aussi étroit que possible. La différence réside dans la manière dont les 95% sont appliqués - un fréquentiste ne se penchera que sur les intervalles proposés où 95% de la surface de chaque tranche horizontale est inférieure à cet intervalle, tandis qu'un bayésien insistera pour que chaque tranche verticale soit telle que 95% de sa surface soit sous l'intervalle.
Beaucoup de non-statisticiens ne comprennent pas cela et se concentrent uniquement sur les tranches verticales. cela les rend bayésiens même s'ils pensent le contraire.