Test G contre le test du chi carré de Pearson


10

Je teste l'indépendance dans une table de contingenceJe ne sais pas si le test G ou le test chi carré de Pearson est meilleur. La taille de l'échantillon est de l'ordre de centaines, mais le nombre de cellules est faible. Comme indiqué sur la page Wikipedia , l'approximation de la distribution du chi carré est meilleure pour le test G que pour le test du chi carré de Pearson. Mais j'utilise la simulation de Monte Carlo pour calculer la valeur de p, alors y a-t-il une différence entre ces deux tests?N×M


Réponses:


8

Ils sont asymptotiquement identiques. Ce ne sont que des façons différentes d'arriver à la même idée. Plus précisément, le test du chi carré de Pearson est un test de score, tandis que le test G est un test de rapport de vraisemblance. Pour avoir une meilleure idée de ces idées, cela peut vous aider à lire ma réponse ici: pourquoi mes valeurs de p diffèrent-elles entre la sortie de régression logistique, le test du chi carré et l'intervalle de confiance pour le bloc opératoire? Pour répondre à votre question directe, si vous calculez la valeur de p par simulation Monte Carlo, cela ne devrait pas avoir d'importance; vous pouvez simplement utiliser celui qui vous convient le mieux. Notez qu'il n'y a pas de problème avec un faible nombre de cellules, seulement (potentiellement) faible prévunumération cellulaire; il est possible d'avoir un faible nombre de cellules et d'avoir des comptes attendus très bien. De plus, ni les comptages réels faibles ni les comptages attendus faibles ne sont importants lorsque la valeur de p est déterminée par simulation.

(Pour ce que ça vaut, j'utiliserais probablement le chi carré de Pearson, parce que R a une fonction pratique pour cela qui inclut la possibilité de simuler la valeur de p.)


quelle est la fonction dans R?
llewmills

@llewmills, chisq.test.
gung - Rétablir Monica


-1

Le test du chi carré et le test G produisent généralement des résultats similaires. Mais la chose la plus importante ici est que vous devez choisir l'un des deux tests et vous y tenir, non seulement pour votre test mentionné, mais pour les tests futurs au cours de vos recherches. Il est conseillé car si vous essayez d'utiliser les deux tests de manière interchangeable, il est très probable que vous augmenterez les chances d'obtenir un faux positif.


2
Quel est le raisonnement par lequel la prétention selon laquelle le risque de faux positif est accru? (À moins que vous vouliez suggérer que le test est choisi en fonction des nombres réels - mais c'est la référence aux nombres pour choisir entre eux qui est le problème, plutôt que l'idée de potentiellement permuter les tests en soi)
Glen_b -Reinstate Monica

2
@Glen_b Chance d'obtenir un faux positif augmente probablement si nous choisissons une valeur de p du test qui est plus favorable à nos hypothèses (au cas où nous essayons les deux tests)
little_monster
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.