L'analyse de puissance est-elle nécessaire dans les statistiques bayésiennes?


19

J'ai fait des recherches récemment sur la vision bayésienne des statistiques classiques. Après avoir lu sur le facteur Bayes, je me suis demandé si l'analyse de puissance était une nécessité dans cette vue des statistiques. Ma principale raison de me demander ceci est que le facteur Bayes semble vraiment être simplement un rapport de vraisemblance. Une fois qu'il est comme 25: 1, il semble que je puisse l'appeler une nuit.

Suis-je loin? Une autre lecture que je peux faire pour en savoir plus? Je lis actuellement ce livre: Introduction to Bayesian Statistics , par WM Bolstad (Wiley-Interscience; 2e éd., 2007).


3
Duplication possible de l' analyse
amibe dit Réintégrer Monica

Réponses:


10

La puissance correspond à la probabilité à long terme de p <0,05 (alpha) dans les études futures. À Bayes, les preuves de l'étude A alimentent les priors de l'étude B, etc. Par conséquent, le pouvoir tel que défini dans les statistiques fréquentistes n'existe pas vraiment.


12
Une vision moins limitée du pouvoir le voit comme une expression de la courbe de risque pour une fonction de perte 0-1. Une analyse bayésienne intègre ce risque sur la probabilité antérieure. Cependant, de bonnes analyses bayésiennes considèrent la sensibilité de leurs résultats au choix de la distribution préalable. Cela semble nous replacer dans le domaine de l'analyse de puissance. Bien qu'il puisse ne pas porter ce nom et être calculé différemment, l'objectif serait le même: à savoir déterminer la taille d'un échantillon à obtenir afin d'être raisonnablement sûr d'atteindre les objectifs de l'étude.
whuber

2
C'est un très bon point Whuber. Cependant, ce n'est pas la seule raison pour les calculs de puissance et beaucoup de Bayésiens diraient que c'est inutile car vous n'avez pas besoin de déterminer N au préalable (une erreur).
John

5
N

2
Je n'ai pas eu l'idée, il y a un certain nombre d'articles où les bayésiens soutiennent que vous pouvez ajouter des sujets jusqu'à ce que vous ayez suffisamment de preuves pour prendre une décision, par opposition aux tests fréquentistes où de tels tests et procédures d'ajout ne fonctionnent pas. Je pourrais rechercher une référence, je suppose. Plus particulièrement, cela revient à proposer comment analyser les données dans les essais cliniques.
John

8
N

14

Vous pouvez effectuer des tests d'hypothèse avec des statistiques bayésiennes. Par exemple, vous pourriez conclure qu'un effet est supérieur à zéro si plus de 95% de la densité postérieure est supérieure à zéro. Ou alternative, vous pouvez utiliser une forme de décision binaire basée sur des facteurs Bayes.

Une fois que vous avez établi un tel système de prise de décision, il est possible d'évaluer la puissance statistique en supposant un processus de génération de données et une taille d'échantillon donnés. Vous pouvez facilement évaluer cela dans un contexte donné en utilisant la simulation.

Cela dit, une approche bayésienne se concentre souvent davantage sur l'intervalle de crédibilité que sur l'estimation ponctuelle et le degré de croyance plutôt que sur une décision binaire. En utilisant cette approche plus continue de l'inférence, vous pourriez plutôt évaluer d'autres effets sur l'inférence de votre conception. En particulier, vous souhaiterez peut-être évaluer la taille attendue de votre intervalle de crédibilité pour un processus de génération de données et une taille d'échantillon donnés.


3

Ce problème conduit à de nombreux malentendus car les gens utilisent les statistiques bayésiennes pour poser des questions fréquentes. Par exemple, les gens veulent déterminer si la variante B est meilleure que la variante A. Ils peuvent répondre à cette question avec des statistiques bayésiennes en déterminant si l'intervalle de densité le plus élevé à 95% de la différence entre ces deux distributions postérieures (BA) est supérieur à 0 ou a région d'importance pratique autour de 0. Si vous utilisez des statistiques bayésiennes pour répondre aux questions fréquentes, cependant, vous pouvez toujours faire des erreurs fréquentistes: type I (faux positifs; opps - B n'est pas vraiment mieux) et type II (manquez; ne réalisez pas que B est vraiment meilleur).

Le but d'une analyse de puissance est de réduire les erreurs de type II (par exemple, avoir au moins 80% de chances de trouver un effet s'il existe). Une analyse de puissance doit également être utilisée lors de l'utilisation des statistiques bayésiennes pour poser des questions fréquentes comme celle ci-dessus.

Si vous n'utilisez pas d'analyse de puissance, puis que vous jetez un œil à plusieurs reprises à vos données lors de leur collecte et que vous ne vous arrêtez qu'une fois que vous avez trouvé une différence significative, vous allez faire plus d'erreurs de type I (fausses alarmes) que vous ne le pensez. - comme si vous utilisiez des statistiques fréquentistes.

check-out:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

À noter - Certaines approches bayésiennes peuvent réduire, mais non éliminer, la probabilité de commettre une erreur de type I (par exemple, une information préalable appropriée).


0

Le besoin d'une analyse de puissance dans un essai clinique par exemple est de pouvoir calculer / estimer le nombre de participants à recruter pour avoir une chance de trouver un effet de traitement (d'une taille minimale donnée) s'il existe. Il n'est pas possible de recruter un nombre infini de patients, d'abord en raison de contraintes de temps et en second lieu en raison de contraintes de coût.

Imaginez donc que nous adoptons une approche bayésienne pour cet essai clinique. Bien que des prieurs plats soient théoriquement possibles, la sensibilité au prieur est de toute façon recommandée car, malheureusement, plus d'un prieur plat est disponible (ce qui est étrange, je pense maintenant, car en réalité il ne devrait y avoir qu'une seule façon d'exprimer une incertitude totale).

Donc, imaginez que, plus loin, nous faisons une analyse de sensibilité (le modèle et pas seulement le prieur serait également examiné ici). Cela implique de simuler à partir d'un modèle plausible de «la vérité». Dans les statistiques classiques / fréquentistes, il y a quatre candidats pour «la vérité» ici: H0, mu = 0; H1, mu! = 0 où l'on observe soit avec erreur (comme dans notre monde réel), soit sans erreur (comme dans le monde réel inobservable). Dans les statistiques bayésiennes, il y a deux candidats pour «la vérité» ici: mu est une variable aléatoire (comme dans le monde réel inobservable); mu est une variable aléatoire (comme dans notre monde réel observable, du point de vue d'un individu incertain).

Donc, cela dépend vraiment de qui vous essayez de convaincre A) par l'essai et B) par l'analyse de sensibilité. Si ce n'est pas la même personne, ce serait assez étrange.

Ce qui est en fait en question, c'est un consensus sur ce qu'est la vérité et sur ce qui justifie les preuves tangibles. Le point commun est que les distributions de probabilités de signature sont observables dans notre monde réel observable qui, d'une manière ou d'une autre, ont évidemment une vérité mathématique sous-jacente qui se trouve être par hasard ou par conception. Je m'arrêterai là car ce n'est pas une page Arts, mais plutôt une page Science, ou c'est ce que je comprends.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.