Dans la littérature sur le taux d'erreur au niveau de la famille (FWER) et sur le taux de fausses découvertes (FDR), des méthodes particulières de contrôle du FWER ou du FDR conviennent aux tests dépendants ou indépendants. Par exemple, dans l'article de 1979 "Une procédure de test multiple à rejet séquentiel simple", Holm a écrit pour comparer sa méthode de Šidák progressive à sa méthode de contrôle de Bonferroni:
La même simplicité de calcul est obtenue lorsque les statistiques de test sont indépendantes .
Dans "Controlling the False Discovery Rate" de Benjamini et Hochberg (1995), les auteurs écrivent:
Théorème 1. Pour des statistiques de test indépendantes et pour toute configuration d'hypothèses fausses nulles, la procédure ci-dessus contrôle le FDR à .
Plus tard, en 2001, Benjamini et Yekutieli écrivent:
1.3. Le problème . Lorsque vous essayez d'utiliser l'approche FDR dans la pratique, les statistiques de test dépendantes sont rencontrées plus souvent que celles indépendantes , l'exemple de points finaux multiples de ce qui précède étant un cas d'espèce.
Quelles significations particulières de dépendant et indépendant ces auteurs utilisent-ils? Je serais heureux d'avoir des définitions formelles de ce qui rend les tests dépendants ou indépendants les uns des autres s'ils accompagnent une explication en langage clair.
Je peux penser à différentes significations possibles, mais je ne comprends pas très bien lesquelles, le cas échéant, elles pourraient être:
"Dépendant" signifie des tests multivariés (c'est-à-dire de nombreuses variables dépendantes avec des prédicteurs identiques ou similaires); indépendant signifie des tests univariés (c'est-à-dire de nombreuses variables indépendantes, une variable dépendante).
"Dépendant" signifie des tests basés sur des sujets appariés / appariés (par exemple test t apparié , mesures répétées ANOVA, etc.); "indépendant" signifie un plan d'étude d'échantillons non appariés / indépendants.
"Dépendant" signifie que la probabilité qu'un test soit rejeté est corrélée avec la probabilité qu'un autre test soit rejeté, et "dépendance positive" signifie que cette corrélation est positive; «indépendant» signifie que les probabilités de rejet ne sont pas corrélées.
Références
Benjamini, Y. et Hochberg, Y. (1995). Contrôler le taux de fausses découvertes: une approche pratique et puissante des tests multiples . Journal de la Royal Statistical Society. Série B (méthodologique) , 57 (1): 289–300.
Benjamini, Y. et Yekutieli, D. (2001). Le contrôle du taux de fausses découvertes dans plusieurs tests sous dépendance . Annals of Statistics , 29 (4): 1165–1188.
Holm, S. (1979). Une simple procédure de test multiple à rejet séquentiel . Scandinavian Journal of Statistics , 6 (65-70): 1979.