Quelles sont les objections pratiques à l’utilisation des méthodes statistiques bayésiennes dans n’importe quel contexte? Non, je ne parle pas de la discussion habituelle sur le choix de l’avant. Je serai ravi si cela ne donne pas de réponses.
Quelles sont les objections pratiques à l’utilisation des méthodes statistiques bayésiennes dans n’importe quel contexte? Non, je ne parle pas de la discussion habituelle sur le choix de l’avant. Je serai ravi si cela ne donne pas de réponses.
Réponses:
Je vais vous donner une réponse. Quatre inconvénients en fait. Notez qu’aucune de ces objections ne devrait en réalité conduire à une analyse fréquentiste, mais il existe par contre un cadre bayésien:
Aucune de ces choses ne devrait vous arrêter. En effet, aucune de ces choses ne m'a arrêté, et j'espère que l'analyse bayésienne aidera au moins au numéro 4.
Je suis un Bayésien par inclination, mais généralement un fréquentiste dans la pratique. La raison en est généralement que l'analyse complète bayésienne effectuée correctement (plutôt que par exemple avec les solutions MAP) pour les types de problèmes qui m'intéressent est délicate et nécessite beaucoup de calcul. Une analyse bayésienne complète est souvent nécessaire pour vraiment voir le bénéfice de cette approche par rapport aux équivalents fréquentistes.
Pour moi, le compromis est essentiellement un choix entre des méthodes bayésiennes conceptuellement élégantes et faciles à comprendre, mais difficiles à mettre en œuvre dans la pratique, et des méthodes fréquentistes, conceptuellement maladroites et subtiles (essayez d'expliquer comment interpréter un test d'hypothèse avec précision ou pourquoi il n’ya pas de probabilité à 95% que la valeur réelle se situe dans un intervalle de confiance de 95%), mais qui conviennent bien à des solutions faciles à mettre en œuvre "livre de recettes".
Chevaux de course.
D'un point de vue purement pratique, je ne suis pas fan des méthodes qui nécessitent beaucoup de calcul (je pense à sampler Gibbs et MCCM, souvent utilisé dans le cadre bayésien, mais cela vaut aussi pour par exemple les techniques bootstrap dans l' analyse fréquentiste). La raison en est que tout type de débogage (test de l'implémentation, analyse de la robustesse vis-à-vis des hypothèses, etc. ) nécessite lui-même un ensemble de simulations de Monte-Carlo, et vous vous retrouvez rapidement plongé dans un embouteillage de calcul. Je préfère que les techniques d'analyse sous-jacentes soient rapides et déterministes, même si elles ne sont qu'approximatives.
Il s’agit bien entendu d’une objection purement pratique: avec des ressources de calcul infinies, cette objection disparaîtrait. Et cela ne s'applique qu'à un sous-ensemble de méthodes bayésiennes. De plus, ceci est davantage une préférence compte tenu de mon flux de travail.
Parfois, il existe une solution simple et naturelle "classique" à un problème, auquel cas une méthode bayésienne sophistiquée (en particulier avec MCMC) serait exagérée.
En outre, dans les problèmes de type à sélection variable, il peut être plus simple et plus clair d’envisager quelque chose comme une vraisemblance pénalisée; il peut exister un préalable sur les modèles qui donne une approche bayésienne équivalente, mais la manière dont le préalable correspond à la performance ultime peut être moins claire que la relation entre la pénalité et la performance.
Enfin, les méthodes MCMC nécessitent souvent un expert à la fois pour évaluer la convergence / mélange et pour donner un sens aux résultats.
Je suis relativement nouveau dans les méthodes bayésiennes, mais ce qui me contrarie, c’est que, même si je comprends la raison d’être des a priori (c’est-à-dire que la science est une entreprise cumulative, la plupart des questions comportent donc une certaine expérience / réflexion antérieure qui devrait vous éclairer. interprétation des données), je n'aime pas que l'approche bayésienne vous oblige à repousser la subjectivité au début de l'analyse, rendant le résultat final contingent. Je pense que cela pose problème pour deux raisons: 1) certains lecteurs moins avertis ne feront même pas attention aux précédents, et interpréteront les résultats bayésiens comme non contingents; 2) à moins que les données brutes ne soient disponibles, il est difficile pour les lecteurs de recadrer les résultats dans leurs propres a priori subjectifs. C’est pourquoi je préfère les ratios de vraisemblance,
(Les critiques avisés remarqueront que même le rapport de vraisemblance est "contingent" en ce sens qu'il est subordonné au paramétrage des modèles comparés; cependant, il s'agit d'une caractéristique commune à toutes les méthodes, Frequentist, Bayesian et Likuthist.)
La théorie de la décision est la théorie sous-jacente sur laquelle repose la statistique. Le problème est de trouver une bonne procédure (dans un certain sens) pour produire des décisions à partir de données. Cependant, il y a rarement un choix de procédure sans ambiguïté, dans le sens de minimiser les pertes attendues, de sorte que d'autres critères doivent être invoqués pour choisir parmi eux. Le choix de la procédure Bayes par rapport à certains antérieurs est l’un de ces critères, mais il se peut que ce ne soit pas toujours ce que vous souhaitiez. Minimax pourrait être plus important dans certains cas, ou impartialité.
Quiconque insiste sur le fait que les fréquentistes ont tort, que les Bayésiens ou que ce soit faux, révèle surtout leur ignorance des statistiques.
Depuis quelque temps, je voulais approfondir mes connaissances sur les approches bayésiennes en matière de modélisation pour dépasser ma compréhension superficielle (j'ai codé des échantillonneurs Gibbs dans des cours de cycles supérieurs, mais je n'ai jamais rien fait de réel). En cours de route, j’ai pensé que certains des journaux de Brian Dennis avaient été provocants et souhaitaient pouvoir trouver un ami bayésien (ceux qui n’étaient pas dans le placard) pour lire les journaux et entendre leurs contrepoint. Donc, voici les documents que je me réfère, mais la citation que je me souviens toujours est
Être bayésien signifie ne jamais avoir à dire que vous avez tort.
http://faculty.washington.edu/skalski/classes/QERM597/papers/Dennis_1996.pdf http://classes.warnercnr.colostate.edu/nr575/files/2011/01/Lele-and-Dennis-2009.pdf
Quels sont les problèmes en suspens dans Bayesian Statistics du bulletin trimestriel ISBA? La liste des 5 problèmes de statistiques bayésiennes de différents leaders du secteur, le n ° 1 étant, assez ennuyeux, "la sélection de modèles et le test d'hypothèses".