Comment les Bayes empiriques sont-ils valables?


24

Je viens donc de terminer la lecture d'un excellent livre Introduction to Empirical Bayes . Je pensais que le livre était génial, mais construire des prieurs à partir des données me semblait mal. J'ai appris que vous proposez un plan d'analyse, puis vous collectez des données, puis vous testez l'hypothèse que vous avez précédemment déterminée dans votre plan d'analyse. Lorsque vous effectuez une analyse sur des données qui ont déjà été collectées, cela vous met dans une inférence post-sélective où vous devez être beaucoup plus strict sur ce que vous appelez "significatif", voir ici . Je pense que l'apprentissage automatique a quelque chose d'analogue qui s'appelle "la sélection des cerises", ce qui signifie choisir des prédicteurs avant de configurer des ensembles de tests et de formation ( Introduction à l'apprentissage statistique ).

Compte tenu de ce que j'ai appris précédemment, il me semble que les Bayes empiriques sont basés sur une base faible. Les gens l'utilisent-ils uniquement dans les paramètres où les données ont été générées de manière passive? Si c'est le cas, cela peut être justifié, mais il ne semble pas correct de l'utiliser lors d'une conception expérimentale rigoureuse, mais je sais que Brad Efron utilise des Bayes empiriques spécifiquement pour la biostatistique, généralement un domaine très NHST.

Mes questions sont:

  1. Comment les Bayes empiriques sont-ils valables?
  2. Dans quelles situations est-il utilisé?
  3. Dans quelles situations éviter d'utiliser l'approche empirique Bayes et pourquoi?
  4. Les gens l'utilisent-ils dans des domaines autres que la biostatistique et si oui, dans quelles situations l'utilisent-ils?

1
Que signifie «valide»? Selon l'éminent bayésien aujourd'hui décédé, DV Lindley, «il n'y a personne de moins bayésien qu'un bayésien empirique».
Mark L. Stone

Réponses:


16

Je pense qu'il est important de se rappeler que différentes méthodes sont bonnes pour différentes choses, et les tests de signification ne sont pas tout ce qu'il y a dans le monde des statistiques.

1 et 3) EB n'est probablement pas une procédure de test d'hypothèse valide, mais elle n'est pas non plus censée l'être.

La validité peut être beaucoup de choses, mais vous parlez de conception expérimentale rigoureuse, nous discutons donc probablement d'un test d'hypothèse qui est censé vous aider à prendre la bonne décision avec une certaine fréquence à long terme. Il s'agit d'un régime strictement dichotomique de type oui / non qui est surtout utile pour les personnes qui doivent prendre une décision de type oui / non. Il y a en effet beaucoup de travail classique à ce sujet par des gens très intelligents. Ces méthodes ont une belle validité théorique dans la limite en supposant que toutes vos hypothèses se vérifient, etc. Cependant, EB n'était certainement pas destiné à cela. Si vous voulez la machinerie des méthodes NHST classiques, respectez les méthodes NHST classiques.


2) EB est mieux appliqué dans les problèmes où vous estimez de nombreuses quantités variables similaires.

Efron lui-même ouvre son livre Large-Scale Inference énumérant trois époques distinctes de l'histoire des statistiques, soulignant que nous sommes actuellement dans

[l'ère] de la production scientifique de masse, dans laquelle les nouvelles technologies caractérisées par le microréseau permettent à une seule équipe de scientifiques de produire des ensembles de données d'une taille que Quetelet envierait. Mais maintenant, le flot de données s'accompagne d'un déluge de questions, peut-être des milliers d'estimations ou de tests d'hypothèses auxquels le statisticien est chargé de répondre ensemble; pas du tout ce que les maîtres classiques avaient en tête.

Il poursuit:

De par leur nature, les arguments empiriques de Bayes combinent des éléments fréquentistes et bayésiens dans l'analyse de problèmes de structure répétée. Les structures répétées sont exactement ce que la production de masse scientifique excelle, par exemple, les niveaux d'expression comparant des sujets malades et sains pour des milliers de gènes en même temps au moyen de puces à ADN.

L'application récente la plus réussie d'EB est peut limma-être disponible sur Bioconductor . Il s'agit d'un ensemble R avec des méthodes pour évaluer l'expression différentielle (c'est-à-dire des puces à ADN) entre deux groupes d'étude à travers des dizaines de milliers de gènes. Smyth montre que leurs méthodes EB produisent une statistique t avec plus de degrés de liberté que si vous deviez calculer des statistiques t génétiques régulières. L'utilisation d'EB ici "équivaut à un rétrécissement des variances estimées de l'échantillon vers une estimation groupée, résultant en une inférence beaucoup plus stable lorsque le nombre de tableaux est petit", ce qui est souvent le cas.

Comme Efron le souligne ci-dessus, cela ne ressemble en rien à ce pour quoi NHST classique a été développé, et le cadre est généralement plus exploratoire que confirmatoire.


4) En règle générale, vous pouvez voir EB comme une méthode de retrait, et il peut être utile partout que le retrait est utile

limmaX1,...,Xkθ^jeJS=(1-c/S2)Xje,S2=j=1kXj,cXje

X¯,

rétrécissement

Plus les quantites à estimer sont similaires, plus il est probable que le retrait soit utile. Le livre auquel vous faites référence utilise les taux de réussite au baseball. Morris (1983) signale une poignée d'autres applications:

  • Partage des revenus --- bureau du recensement. Estimations du revenu du recensement par habitant pour plusieurs régions.
  • Assurance qualité --- Bell Labs. Estime le nombre de pannes pour différentes périodes.
  • Établissement des tarifs d'assurance. Estime le risque par exposition pour des groupes d'assurés ou pour différents territoires.
  • Admission à la faculté de droit. Estime le poids du score LSAT par rapport au GPA pour différentes écoles.
  • Alarmes incendie --- NYC. Estime le taux de fausses alarmes pour différents emplacements de boîte d'alarme.

Ce sont tous des problèmes d'estimation parallèle et, autant que je sache, ils visent davantage à faire une bonne prédiction de ce qu'est une certaine quantité qu'à déterminer une décision oui / non.


Quelques références

  • Efron, B. (2012). Inférence à grande échelle: méthodes bayésiennes empiriques d'estimation, de test et de prévision (Vol. 1). La presse de l'Universite de Cambridge. Chicago
  • Efron, B. et Morris, C. (1973). La règle d'estimation de Stein et ses concurrents - une approche empirique de Bayes. Journal de l'American Statistical Association, 68 (341), 117-130. Chicago
  • James, W., & Stein, C. (1961, juin). Estimation avec perte quadratique. Dans Actes du quatrième symposium de Berkeley sur les statistiques mathématiques et les probabilités (Vol. 1, n ° 1961, pp. 361-379). Chicago
  • Morris, CN (1983). Inférence empirique paramétrique de Bayes: théorie et applications. Journal de l'American Statistical Association, 78 (381), 47-55.
  • Smyth, GK (2004). Modèles linéaires et méthodes bayésiennes empiriques pour évaluer l'expression différentielle dans des expériences de puces à ADN. Applications statistiques en génétique et biologie moléculaire Volume 3, numéro 1, article 3.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.