(Pour rendre nos notions un peu plus précises, appelons la «statistique de test» la distribution de la chose que nous recherchons pour réellement calculer la valeur de p. Cela signifie que pour un test t bilatéral, notre statistique de test serait plutôt que T. )| T|T
Ce qu'une statistique de test fait est d'induire un ordre sur l'espace échantillon (ou plus strictement, un ordre partiel), afin que vous puissiez identifier les cas extrêmes (les plus cohérents avec l'alternative).
Dans le cas du test exact de Fisher, il y a déjà un ordre dans un sens - ce sont les probabilités des différentes tables 2x2 elles-mêmes. En l'occurrence, elles correspondent à l'ordre sur en ce sens que les valeurs les plus grandes ou les plus petites de sont «extrêmes» et ce sont aussi celles avec la plus faible probabilité. Donc, plutôt que de regarder les valeurs de de la manière que vous suggérez, on peut simplement travailler à partir des extrémités grandes et petites, à chaque étape en ajoutant simplement la valeur (la plus grande ou la plus petiteX1 , 1X1 , 1 X 1 , 1 X 1 , 1X1 , 1X1 , 1-valeur pas déjà là) a la plus petite probabilité qui lui est associée, continue jusqu'à ce que vous atteigniez votre table observée; lors de son inclusion, la probabilité totale de tous ces tableaux extrêmes est la valeur de p.
Voici un exemple:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
La première colonne valeurs , la deuxième colonne les probabilités et la troisième colonne l'ordre ordonné.X1 , 1
Ainsi, dans le cas particulier du test exact de Fisher, la probabilité de chaque table (de manière équivalente, de chaque valeur ) peut être considérée comme la statistique de test réelleX1 , 1 .
Si vous comparez la statistique de test suggérée, elle induit le même ordre dans ce cas (et je crois que c'est le cas en général, mais je n'ai pas vérifié), en ce que les valeurs plus élevées de cette statistique sont les valeurs plus petites de la probabilité, de sorte qu'elle pourrait également être considérée comme «la statistique» - mais il en est de même pour de nombreuses autres quantités - en effet, toutes celles qui préservent cet ordre des s dans tous les cas sont des statistiques de test équivalentes, car elles produisent toujours des valeurs de p identiques.| X1 , 1- μ |X 1 , 1X1 , 1
Notez également qu'avec la notion plus précise de «statistique de test» introduite au début, aucune des statistiques de test possibles pour ce problème n'a en fait une distribution hypergéométrique; fait, mais ce n'est pas en fait une statistique de test appropriée pour le test bilatéral (si nous faisions un test unilatéral où seule une association plus importante dans la diagonale principale et non dans la deuxième diagonale était considérée comme cohérente avec la alternative, ce serait une statistique de test). C'est exactement le même problème unilatéral / bilatéral avec lequel j'ai commencé.X1 , 1
[Edit: certains programmes présentent une statistique de test pour le test de Fisher; Je suppose que ce serait un calcul de type -2logL qui serait asymptotiquement comparable à un chi carré. Certains peuvent également présenter le rapport de cotes ou son journal, mais ce n'est pas tout à fait équivalent.]