Je pense qu'il est légitime de citer la partie pertinente du paragraphe en question:
3. Le test KS ne peut pas être appliqué en deux dimensions ou plus. Les astronomes ont souvent des ensembles de données avec des points répartis dans un plan ou des dimensions supérieures, plutôt que le long d'une ligne. Plusieurs articles de la littérature astronomique prétendent présenter un test KS bidimensionnel, et un est reproduit dans le célèbre volume Numerical Recipes. Cependant, aucun test basé sur EDF (cela inclut les tests KS, AD et connexes) ne peut être appliqué en deux dimensions ou plus, car il n'y a pas de moyen unique de classer les points afin que les distances entre les EDF bien définis puissent être calculées. On peut construire une statistique basée sur une procédure de classement, puis calculer les distances suprêmes entre deux jeux de données (ou un jeu de données et une courbe). Mais les valeurs critiques de la statistique résultante ne sont pas sans distribution.
Comme indiqué, cela semble trop fort.
1) La fonction de distribution bivariée, qui est est une carte de R 2 à [ 0 , 1 ] . Autrement dit, la fonction prenddes valeurs réellesunivariéesentre 0 et 1. Ces valeurs - étant des probabilités - sont certainement déjà "ordonnées" - et c'est là (la valeur de la fonction) que nous devons faire des comparaisons pour les tests basés sur ECDF . De même, le ECDF, FF( x1, x2) = P( X1≤ x1, X2≤ x2)R2[ 0 , 1 ]F^ est parfaitement bien défini dans le cas bivarié.
Je ne pense pas qu'il soit nécessairement nécessaire d'essayer de le transformer en une fonction d'une variable combinée univariée comme le suggère le texte. Vous calculez simplement et F à chaque combinaison requise et de calculer la différence.FF^
2) Cependant, sur la question de savoir si c'est sans distribution, ils ont un point:
a) il est clair qu'une telle statistique de test ne serait pas altérée par des modifications des transformations des marges, c'est-à-dire si elle est construite comme un test d'uniformes indépendants bivariés, , alors elle fonctionne aussi bien que un test d'indépendant ( X 1 , X 2 ) où U i = F i ( X i ) . En ce sens, il est sans distribution (on pourrait dire «sans marge»).U =( U1, U2)( X1, X2)Uje= Fje( Xje)
b) cependant, il y a un point sous-jacent plus généralement au sens large qu'une version naïve de la statistique KS (comme je viens de le décrire) n'est pas plus généralement libre de distribution; on ne peut pas simplement transformer arbitrairement X ∗ = g ( U ) .UX∗= g ( U )
Dans une version antérieure de ma réponse, j'ai dit:
Il n'y a pas de difficulté, pas de problème
C'est faux. Il y a effectivement des problèmes s'il y a un changement non seulement des marges des uniformes indépendants bivariés, comme je viens de le mentionner. Cependant, ces difficultés ont été examinées de plusieurs manières dans un certain nombre d'articles qui produisent des versions bivariées / multivariées des statistiques de Kolmogorov-Smirnov qui ne souffrent pas de ce problème.
Je reviendrai peut-être pour ajouter certaines de ces références et discuter de leur fonctionnement dès que le temps le permettra.