Comment et quand utiliser l'ajustement Bonferroni


21

J'ai deux questions concernant le moment d'utiliser un ajustement Bonferroni:

  • Est-il approprié d'utiliser un ajustement Bonferroni dans tous les cas de tests multiples?
  • Si l'on effectue un test sur un ensemble de données, alors on divise cet ensemble de données en niveaux plus fins (par exemple, divise les données par sexe) et effectue les mêmes tests, comment cela pourrait-il affecter le nombre de tests individuels qui sont perçus? Autrement dit, si X hypothèses sont testées sur un ensemble de données contenant des données à la fois des hommes et des femmes, puis l'ensemble de données est divisé pour donner séparément les données hommes et femmes et les mêmes hypothèses testées, le nombre d'hypothèses individuelles resterait-il égal à X ou augmenterait-il en raison de les tests supplémentaires?

Merci pour vos commentaires.

Réponses:


14

L'ajustement de Bonferroni fournira toujours un contrôle fort du taux d'erreur familial. Cela signifie que, quels que soient la nature et le nombre des tests, ou les relations entre eux, si leurs hypothèses sont remplies, cela garantira que la probabilité d'avoir un seul résultat significatif erroné parmi tous les tests est au maximum , votre erreur d'origine niveau. Il est donc toujours disponible .α

Qu'il soit approprié de l'utiliser (par opposition à une autre méthode ou peut-être pas d'ajustement du tout) dépend de vos objectifs, des normes de votre discipline et de la disponibilité de meilleures méthodes pour votre situation spécifique. À tout le moins, vous devriez probablement envisager la méthode Holm-Bonferroni, qui est tout aussi générale mais moins conservatrice.

En ce qui concerne votre exemple, puisque vous effectuez plusieurs tests, vous êtes augmenter le taux d'erreur sage famille (la probabilité de rejeter au moins une hypothèse nulle par erreur). Si vous effectuez un seul test sur chaque moitié, de nombreux ajustements seraient possibles, y compris la méthode de Hommel ou les méthodes contrôlant le taux de fausses découvertes (qui est différent du taux d'erreur familial). Si vous effectuez un test sur l'ensemble des données suivi de plusieurs sous-tests, les tests ne sont plus indépendants et certaines méthodes ne sont plus appropriées. Comme je l'ai déjà dit, Bonferroni est en tout cas toujours disponible et garanti de fonctionner comme annoncé (mais aussi d'être très conservateur…).

Vous pouvez également ignorer tout le problème. Formellement, le taux d'erreur familial est plus élevé, mais avec seulement deux tests, il n'est toujours pas si mauvais. Vous pouvez également commencer par un test sur l'ensemble des données, traité comme le résultat principal, suivi de sous-tests pour différents groupes, non corrigés car ils sont compris comme des résultats secondaires ou des hypothèses auxiliaires.

Si vous considérez de nombreuses variables démographiques de cette manière (au lieu de simplement planifier de tester les différences entre les sexes dès le départ ou peut-être une approche de modélisation plus systématique), le problème devient plus grave avec un risque important de «dragage de données» (une différence sort significativement par hasard vous permettant de sauver une expérience non concluante avec une belle histoire sur la variable démographique à démarrer alors qu'en fait rien ne s'est vraiment passé) et vous devriez certainement envisager une forme d'ajustement pour plusieurs tests. La logique reste la même avec X hypothèses différentes (tester X hypothèses deux fois - une sur chaque moitié de l'ensemble de données - entraîne un taux d'erreur familial plus élevé que tester X hypothèses une seule fois et vous devriez probablement vous y adapter).


1
Notez que pour les variables discrètes, il existe des méthodes moins conservatrices que celles de Holm (par exemple min-P).

2

Je regardais le même problème et j'ai trouvé un texte dans le livre:

Une copie du chapitre pertinent est disponible gratuitement ici:

http://www.utdallas.edu/~herve/Abdi-Bonferroni2007-pretty.pdf

il explique comment la correction de Bonferonni peut être appliquée dans différentes circonstances (c'est-à-dire des tests indépendants et non indépendants) et mentionne brièvement quelques alternatives. Il mentionne également que, lorsque le nombre de comparaisons que vous testez devient important, le test peut devenir trop conservateur et ne vous permet plus de trouver quoi que ce soit de significatif (si vous deviez faire 10 comparaisons, vous auriez à , pour 20 tests c'est 0,002, etc.)α[PT]=1-(1-0,05)(1/dix)=0,0051

Pour être honnête, j'ai examiné de nombreux articles économiques / économétriques différents pour mon projet de recherche actuel et dans cette expérience limitée, je n'ai pas trouvé beaucoup d'articles appliquant de telles corrections lors de la comparaison de 2 à 5 tests.


Pouvez-vous fournir un résumé des informations contenues dans le lien ici pour aider les futurs lecteurs à décider s'ils souhaitent les poursuivre et au cas où le lien disparaîtrait?
gung - Rétablir Monica

0

Vous devez vous rappeler que les données médicales et les données scientifiques sont irrémédiablement différentes en ce sens que les données médicales hétéroscédastiques ne sont jamais expérimentales contrairement aux données biologiques homoscédastiques. Rappelons également que de nombreuses discussions sur le rôle des tests de puissance et des corrections de type Bonferroni n'impliquent que des spéculations sur la nature des distributions alternatives inconnaissables. La définition de la bêta dans un calcul de puissance est une procédure arbitraire. Aucun des statisticiens médicaux n'annonce cela. Deuxièmement, s'il y a autocorrélation d'échantillons de données (à l'intérieur), le théorème central limite a été violé et les tests gaussiens basés sur la normale ne sont pas valides. Troisième, rappelons que la Distribution Normale devient démodée dans le sens où de nombreux phénomènes médicaux sont des distributions fractales qui ne possèdent ni moyens finis et / ou variances finies (distributions de type Cauchy) et nécessitent des analyses statistiques résistantes aux fractales. Effectuer une analyse post-hoc dépendant de ce que vous trouvez lors d'une analyse précoce est incorrect. Enfin, la bijectivité entre les sujets n'est pas nécessairement valide et les conditions des corrections de Bonferroni sont des éléments importants qui doivent être étudiés de manière unique uniquement pendant la conception expérimentale a priori. Nigel T. James. MB BChir, (diplômes de médecine au Royaume-Uni), MSc (en statistiques appliquées). la bijectivité entre les sujets n'est pas nécessairement valide et les conditions pour les corrections de Bonferroni sont des éléments importants qui doivent être étudiés de manière unique uniquement pendant la conception expérimentale a priori. Nigel T. James. MB BChir, (diplômes de médecine au Royaume-Uni), MSc (en statistiques appliquées). la bijectivité entre les sujets n'est pas nécessairement valide et les conditions pour les corrections de Bonferroni sont des éléments importants qui doivent être étudiés de manière unique uniquement pendant la conception expérimentale a priori. Nigel T. James. MB BChir, (diplômes de médecine au Royaume-Uni), MSc (en statistiques appliquées).

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.