Peut-on utiliser le test d'ajustement de Kolmogorov-Smirnov pour comparer deux distributions empiriques afin de déterminer si elles semblent provenir de la même distribution sous-jacente, plutôt que de comparer une distribution empirique à une distribution de référence prédéfinie?
Permettez-moi d'essayer de poser cette question d'une autre manière. Je collecte N échantillons d'une distribution à un endroit. Je collecte M échantillons à un autre endroit. Les données sont continues (chaque échantillon est un nombre réel compris entre 0 et 10, par exemple) mais pas normalement distribuées. Je veux tester si ces échantillons N + M proviennent tous de la même distribution sous-jacente. Est-il raisonnable d'utiliser le test de Kolmogorov-Smirnov à cette fin?
En particulier, j'ai pu calculer la distribution empirique partir des N échantillons, et la distribution empirique F 1 à partir des M échantillons. Ensuite, j'ai pu calculer la statistique du test de Kolmogorov-Smirnov pour mesurer la distance entre F 0 et F 1 : c'est-à-dire calculer D = sup x | F 0 ( x ) - F 1 ( x ) | et utilisez Dcomme ma statistique de test comme dans le test de Kolmogorov-Smirnov pour la qualité de l'ajustement. Est-ce une approche raisonnable?
(J'ai lu ailleurs que le test de Kolmogorov-Smirnov pour la qualité de l'ajustement n'est pas valable pour les distributions discrètes , mais j'avoue que je ne comprends pas ce que cela signifie ou pourquoi cela pourrait être vrai. Cela signifie-t-il que mon approche proposée est mauvaise? )
Ou recommandez-vous autre chose à la place?