Fonctionnement du test Chi Squared de Pearson

À la suite d'un récent vote à la baisse, j'ai essayé de vérifier ma compréhension du test Pearson Chi Squared. J'utilise généralement la statistique du chi carré (ou la statistique du chi carré réduit) pour ajuster ou vérifier l'ajustement résultant. Dans ce cas, la variance n'est généralement pas le nombre attendu de dénombrements dans un tableau ou un histogramme, mais une certaine variance déterminée expérimentalement. Quoi qu'il en soit, j'ai toujours eu l'impression que le test utilisait toujours la normalité asymptotique du PDF multinomial (c'est-à-dire que ma statistique de test est

Q = (n - N m)^{⊤} V^{- 1} (n - N m)

$Q = (n-Nm)^\top V^{-1}(n-Nm)$

et est multinormal asymptotiquement où est la matrice de covariance). Par conséquent, a une distribution chi carré donnée par un grand donc l'utilisation du nombre attendu de dénombrements comme le dénominateur dans la statistique devient valide pour le grand . Il est possible que cela ne soit vrai que pour les histogrammes, je n'ai pas analysé un petit tableau de données depuis des années. $(n-Nm)$ $V$ $Q$ $n$ $n$

Y a-t-il un argument plus subtil que je manque? Je serais intéressé par une référence, ou mieux encore une courte explication. (Bien que ce soit possible, je viens de voter pour avoir omis le mot asymptotique, ce que je concède est assez important.)

chi-squared histogram

— Bowler
source

Il en découle vraisemblablement qu'il est également vrai que l'on pourrait utiliser exactement le même test avec toutes les données normalement distribuées. Si je devais utiliser un voltmètre que je savais avoir une erreur normalement distribuée que j'avais déterminée, je pourrais utiliser, . Est-ce vrai? La statistique du chi carré réduit repose probablement sur ce fait.

χ^{2} = \sum_{je} \frac{(V_{o b s} - V_{e X p})^{2}}{σ^{2}}

$\chi^{2} = \sum_{i} \frac{(V_{obs} - V_{exp})^{2}}{\sigma^{2}}$

— Bowler

Un test du chi carré est conçu pour analyser des données catégorielles. Cela signifie que les données ont été comptées et divisées en catégories. Il ne fonctionnera pas avec des données paramétriques ou continues. Donc, cela ne fonctionne pas pour déterminer l'ajustement résultant dans chaque cas.

Source: http://www.ling.upenn.edu/~clight/chisquared.htm

— BradHanks
source

Bienvenue sur ce site! Je ne suis pas sûr de comprendre comment cela se rapporte à la question à l'étude. Pourriez-vous étendre un peu cette réponse, en gardant à l'esprit que ce fil porte probablement plus sur le test d' adéquation que sur l'analyse des tableaux de contingence bidirectionnels?

— chl

J'ai peut-être mal compris la question, mais je me demandais si le test du chi carré était approprié dans cet exemple. Je pourrais être un peu rouillé ...

— BradHanks

L'application décrite dans la question est "utilisez la statistique du chi carré ... pour ajuster ou vérifier l'ajustement résultant". La distribution d'une variable aléatoire peut être testée en partageant ses valeurs possibles en un nombre fini de sous - ensembles, en comptant le nombre de résultats iid qui entrent dans chaque sous - ensemble, et l' application d' un test sur ces comptes (qui sont évidemment catégoriques) . En ce sens , vous êtes à la fois correct et incorrect: le test analyse compte , mais néanmoins , il fait le travail avec des données continues. BTW, "données paramétriques" est absurde.

χ^{2}

$\chi^2$

χ^{2}

$\chi^2$

— whuber