Prenons le cas le plus simple pour essayer de fournir le plus d'intuition. Soit un échantillon iid d'une distribution discrète avec k résultats. Soit π 1 , … , π k les probabilités de chaque résultat particulier. Nous nous intéressons à la distribution (asymptotique) de la statistique du chi carré
X 2 = k ∑ i = 1 ( S i - n π i ) 2X1,X2,…,Xnkπ1,…,πk
Ici n π i est le nombre attendu de dénombrements du i ème résultat.
X2=∑i=1k(Si−nπi)2nπi.
nπii
Une heuristique suggestive
Définissez , de sorte queX2=∑iU 2 i =‖U‖ 2 2 oùU=(U1,…,Uk).Ui=(Si−nπi)/nπi−−−√X2=∑iU2i=∥U∥22U=(U1,…,Uk)
Puisque est B i n ( n , π i ) , alors par le théorème de la limite centrale ,
T i = U iSiBin(n,πi)
conséquent, nous avons aussi cela, U i d → N ( 0 , 1 - π i ) .
Ti=Ui1−πi−−−−−√=Si−nπinπi(1−πi)−−−−−−−−−√→dN(0,1),
Ui→dN(0,1−πi)
Maintenant, si les étaient (asymptotiquement) indépendants (ce qu'ils ne sont pas), alors nous pourrions faire valoir que
∑ i T 2 iTi∑iT2i était asymptotiquement distribué. Mais, notez que T k est une fonction déterministe de ( T 1 , … , T k - 1 ) et que les variables T i ne peuvent donc pas être indépendantes.χ2kTk(T1,…,Tk−1)Ti
Par conséquent, nous devons prendre en compte la covariance entre eux d'une manière ou d'une autre. Il s'avère que la façon "correcte" de le faire est d'utiliser à la place le , et la covariance entre les composants de U change également la distribution asymptotique de ce que nous aurions pu penser être χ 2 k à ce qui est, en fait, a χ 2 k - 1 .UiUχ2kχ2k−1
Quelques détails à ce sujet suivent.
Un traitement plus rigoureux
Il n'est pas difficile de vérifier qu'en fait,
pouri≠j.Cov(Ui,Uj)=−πiπj−−−−√i≠j
Donc, la covariance de est
A = I - √U
où √
A=I−π−−√π−−√T,
. Notez que
Aest symétrique et idempotent,savoir
A=A2=AT. Ainsi, en particulier, si
Z=(Z1,…,Zk)a iid des composantes normales standard, alors
AZ∼N(0,A). (
NBLa distribution normale multivariée dans ce cas est
dégénérée.)
π−−√=(π1−−√,…,πk−−√)AA=A2=ATZ=(Z1,…,Zk)AZ∼N(0,A)
Maintenant, le multivariée théorème central limite , le vecteur a une distribution normale à plusieurs variables asymptotique avec une moyenne 0 et covariance A .U0A
Donc, a la même distribution asymptotique que A Z , par conséquent, la même distribution asymptotique de
X 2 = U T U est la même que la distribution de Z T A T A Z = Z T A Z par le théorème de cartographie continue .UAZX2=UTUZTATAZ=ZTAZ
Mais, est symétrique et idempotent, donc ( a ) il a des vecteurs propres orthogonaux, ( b ) toutes ses valeurs propres sont 0 ou 1, et ( c ) la multiplicité de la valeur propre de 1 est r a n k ( A ) . Cela signifie que A peut être décomposé en A = Q D Q T où Q est orthogonal et D est une matrice diagonale avec r a n k ( A ) sur la diagonale et les entrées diagonales restantes étant nulles.Arank(A)AA=QDQTQDrank(A)
Ainsi, doit être χ 2 k - 1 distribué puisque
A a le rang k - 1 dans notre cas.ZTAZχ2k−1Ak−1
Autres connexions
La statistique du chi carré est également étroitement liée aux statistiques du rapport de vraisemblance. En effet, il s'agit d'une statistique de score de Rao et peut être considérée comme une approximation de la série Taylor de la statistique du rapport de vraisemblance.
Les références
C'est mon propre développement basé sur l'expérience, mais évidemment influencé par des textes classiques. Les bons endroits où chercher pour en savoir plus sont
- GAF Seber et AJ Lee (2003), Linear Regression Analysis , 2e éd., Wiley.
- E. Lehmann et J. Romano (2005), Testing Statistical Hypotheses , 3e éd., Springer. Section 14.3 en particulier.
- DR Cox et DV Hinkley (1979), Statistiques théoriques , Chapman et Hall.