Quelle est la statistique de test dans le test exact de Fisher?

9

Pour un 2 par 2 tableau de contingence, certains ont dit test exact de Fisher utilise le nombre dans la cellule (1,1) dans le tableau que la statistique de test, et sous l' hypothèse nulle, volonté avoir une distribution hypergéométrique. $X_{1,1}$ $X_{1,1}$

Certains ont déclaré que sa statistique de test est

| X_{1, 1} - μ |

$|X_{1,1} - \mu|$ où

μ

$\mu$ est la moyenne de la distribution hypergéométrique (mentionnée ci-dessus) sous null. Il a également déclaré que les valeurs de p sont déterminées en fonction du tableau de distribution hypergométrique. Je me demandais s'il y avait une raison de soustraire la moyenne et ensuite de prendre la valeur absolue?

| X_{1, 1} - μ |

$|X_{1,1} - \mu|$ n'a pas de distribution hypergéométrique sous null, n'est-ce pas?

hypothesis-testing fishers-exact hypergeometric

— Tim
source

10

(Pour rendre nos notions un peu plus précises, appelons la «statistique de test» la distribution de la chose que nous recherchons pour réellement calculer la valeur de p. Cela signifie que pour un test t bilatéral, notre statistique de test serait plutôt que ) $|T|$ $T$

Ce qu'une statistique de test fait est d'induire un ordre sur l'espace échantillon (ou plus strictement, un ordre partiel), afin que vous puissiez identifier les cas extrêmes (les plus cohérents avec l'alternative).

Dans le cas du test exact de Fisher, il y a déjà un ordre dans un sens - ce sont les probabilités des différentes tables 2x2 elles-mêmes. En l'occurrence, elles correspondent à l'ordre sur en ce sens que les valeurs les plus grandes ou les plus petites de sont «extrêmes» et ce sont aussi celles avec la plus faible probabilité. Donc, plutôt que de regarder les valeurs de de la manière que vous suggérez, on peut simplement travailler à partir des extrémités grandes et petites, à chaque étape en ajoutant simplement la valeur (la plus grande ou la plus petite $X_{1,1}$ $X_{1,1}$ $X_{1,1}$ $X_{1,1}$ -valeur pas déjà là) a la plus petite probabilité qui lui est associée, continue jusqu'à ce que vous atteigniez votre table observée; lors de son inclusion, la probabilité totale de tous ces tableaux extrêmes est la valeur de p.

Voici un exemple:

fonction de probabilité hypergéométrique

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

La première colonne valeurs , la deuxième colonne les probabilités et la troisième colonne l'ordre ordonné. $X_{1,1}$

Ainsi, dans le cas particulier du test exact de Fisher, la probabilité de chaque table (de manière équivalente, de chaque valeur ) peut être considérée comme la statistique de test réelle $X_{1,1}$ .

Si vous comparez la statistique de test suggérée, elle induit le même ordre dans ce cas (et je crois que c'est le cas en général, mais je n'ai pas vérifié), en ce que les valeurs plus élevées de cette statistique sont les valeurs plus petites de la probabilité, de sorte qu'elle pourrait également être considérée comme «la statistique» - mais il en est de même pour de nombreuses autres quantités - en effet, toutes celles qui préservent cet ordre des s dans tous les cas sont des statistiques de test équivalentes, car elles produisent toujours des valeurs de p identiques. $|X_{1,1}-\mu|$ $X_{1,1}$

Notez également qu'avec la notion plus précise de «statistique de test» introduite au début, aucune des statistiques de test possibles pour ce problème n'a en fait une distribution hypergéométrique; fait, mais ce n'est pas en fait une statistique de test appropriée pour le test bilatéral (si nous faisions un test unilatéral où seule une association plus importante dans la diagonale principale et non dans la deuxième diagonale était considérée comme cohérente avec la alternative, ce serait une statistique de test). C'est exactement le même problème unilatéral / bilatéral avec lequel j'ai commencé. $X_{1,1}$

[Edit: certains programmes présentent une statistique de test pour le test de Fisher; Je suppose que ce serait un calcul de type -2logL qui serait asymptotiquement comparable à un chi carré. Certains peuvent également présenter le rapport de cotes ou son journal, mais ce n'est pas tout à fait équivalent.]

— Glen_b -Reinstate Monica
source

Merci, Glen_b! la distribution de sous null est la distribution hypergéométrique, qui n'est pas symétrique autour de sa moyenne . Je me demandais donc siest une statistique de test raisonnable?

X_{1, 1}

$X_{1,1}$

μ

$\mu$

| X_{1, 1} - μ |

$|X_{1,1} - \mu|$

— Tim

Cela semble une statistique de test éminemment raisonnable, car elle est complètement interprétable et facilement compréhensible. En effet, aucune des statistiques possibles n'aura une distribution symétrique. Oublions les spécificités du test de Fisher pendant un moment - si cette statistique est significative pour vous, vous pouvez calculer un test exact sur cette base (en utilisant des calculs hypergéométriques pour trouver les probabilités). Si vous voulez montrer qu'ils induisent le même ordre dans tous les cas, c'est probablement une nouvelle question.

— Glen_b -Reinstate Monica

6

$|X_{1,1} - \mu|$ ne peut pas avoir une distribution hypergéométrique en général parce que n'a pas besoin d'être une valeur entière et alorsne serait pas un entier. Mais conditionnellement aux marges, aura une distribution hypergéométrique. $\mu$ $|X_{1,1} - \mu|$ $X_{1,1}$

Si vous le faites correctement et fixez les marges à des valeurs connues, vous pouvez considérer (ou toute autre cellule) comme votre statistique. Avec l'analogie de dessiner boules dans une urne contenant boules blanches et boules noires sans remplacement, peut être interprété comme le nombre de boules blanches tirées, où est la somme de la première rangée, est la somme de la deuxième ligne, est la somme de la première colonne. $X_{1,1}$ $k$ $W$ $B$ $X_{1,1}$ $B$ $W$ $k$

— gui11aume
source

4

Il n'en a pas vraiment. Les statistiques de test sont une anomalie historique - la seule raison pour laquelle nous avons une statistique de test est d'obtenir une valeur p. Le test exact de Fisher dépasse une statistique de test et passe directement à une valeur de p.

— Jeremy Miles
source

Merci, mais n'y a-t-il vraiment pas de statistique de test? Comment déterminez-vous alors la valeur p?

— Tim

Le résultat du test exact de Fisher est la valeur de p.

— Jeremy Miles

@JeremyMiles: Voulez-vous dire que les statistiques de test sont des anomalies historiques en ce sens qu'avant le calcul à faible coût, les utilisateurs ont calculé Z, t et ainsi de suite, puis ont comparé cette statistique de test aux tableaux pré-calculés pour déterminer la signification statistique, et par conséquent, de nombreux utilisateurs actuels de statistiques inférentielles pensent encore en termes de statistiques de test quand ils pourraient tout aussi facilement fournir une valeur p? En d'autres termes, s'agit-il d'une sorte d'effet générationnel?

— rabidotter

1

@rabidotter - oui, je suppose que oui. Vous voyez des gens qui écrivent "F = 14,352, df = 2, 568, p <0,05". À peu près la seule raison pour laquelle quiconque se soucie de F est de calculer P, mais ils donnent F à une précision massive et p à très peu de précision.

— Jeremy Miles