c'est une excellente question.
Le test exact de Fisher est l'un des bons exemples de l'utilisation intelligente du plan expérimental par Fisher , ainsi que du conditionnement des données (essentiellement des tableaux avec les totaux des lignes observés et marginaux) et de son ingéniosité pour trouver des distributions de probabilité (bien que ce ne soit pas le meilleur exemple , pour un meilleur exemple, voir ici ). L'utilisation d'ordinateurs pour calculer des valeurs p "exactes" a certainement permis d'obtenir des réponses précises.
Cependant, il est difficile de justifier les hypothèses du test exact de Fisher dans la pratique. Parce que le prétendu "exact" vient du fait que dans "l'expérience de dégustation de thé" ou dans le cas des tableaux de contingence 2x2, le total des lignes et le total des colonnes, c'est-à-dire que les totaux marginaux sont fixés par conception. Cette hypothèse est rarement justifiée dans la pratique. Pour de bonnes références, voir ici .
Le nom "exact" amène à croire que les valeurs p données par ce test sont exactes, ce qui, malheureusement, est malheureusement toujours incorrect pour la plupart des cas, pour ces raisons.
- Si les marginaux ne sont pas fixés par conception (ce qui se produit presque chaque fois dans la pratique), les valeurs p seront conservatrices.
- Comme le test utilise une distribution de probabilité discrète (en particulier la distribution hyper-géométrique), il est impossible de calculer les "probabilités nuls exactes", c'est-à-dire la valeur p.
Dans la plupart des cas pratiques, l'utilisation d'un test du rapport de vraisemblance ou d'un test du chi carré ne devrait pas donner de réponses très différentes (valeur p) du test exact de Fisher. Oui, lorsque les marginaux sont fixes, le test exact de Fisher est un meilleur choix, mais cela se produira rarement. Par conséquent, l'utilisation du test du chi carré du test du rapport de vraisemblance est toujours recommandée pour les contrôles de cohérence.
Des idées similaires s’appliquent lorsque le test exact de Fisher est généralisé à n’importe quel tableau, ce qui revient en gros à calculer des prédictions hypergéométriques à plusieurs variables. Par conséquent, il faut toujours essayer de calculer les valeurs de p basées sur la distribution du rapport de probabilité et de chi carré, en plus des valeurs de p "exactes".