Réponses:
Comme l'a souligné Stijn, le test ks renvoie une statistique D et une valeur p correspondant à la statistique D. La statistique D est la distance maximale absolue (supremum) entre les CDF des deux échantillons. Plus ce nombre est proche de 0, plus il est probable que les deux échantillons ont été tirés de la même distribution. Consultez la page Wikipedia pour le test ks. Il fournit une bonne explication: https://en.m.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
La valeur de p renvoyée par le test ks a la même interprétation que les autres valeurs de p. Vous rejetez l'hypothèse nulle selon laquelle les deux échantillons ont été tirés de la même distribution si la valeur p est inférieure à votre niveau de signification. Vous pouvez trouver des tableaux en ligne pour la conversion de la statistique D en une valeur p si vous êtes intéressé par la procédure.
Lorsque vous effectuez une recherche Google sur ks_2samp, le premier accès est ce site Web. Sur celui-ci, vous pouvez voir la spécification de la fonction:
This is a two-sided test for the null hypothesis that 2 independent samples are drawn from the same continuous distribution.
Parameters :
a, b : sequence of 1-D ndarrays
two arrays of sample observations assumed to be drawn from a continuous distribution, sample sizes can be different
Returns :
D : float, KS statistic
p-value : float, two-tailed p-value