Il existe de nombreuses façons de mesurer la similarité des deux distributions de probabilité. Parmi les méthodes qui sont populaires (dans différents cercles) figurent:
la distance de Kolmogorov: la distance supérieure entre les fonctions de distribution;
la distance de Kantorovich-Rubinstein: la différence maximale entre les attentes par rapport aux deux distributions de fonctions à constante de Lipschitz , qui se révèle être également la distance entre les fonctions de distribution;
la distance bornée-Lipschitz: comme la distance KR, mais les fonctions doivent également avoir une valeur absolue au plus égale à .
Ceux-ci présentent des avantages et des inconvénients différents. Seule la convergence au sens de 3 correspond précisément à la convergence de la distribution; la convergence au sens de 1 ou 2 est légèrement plus forte en général. (En particulier, si avec une probabilité de , converge vers dans la distribution, mais pas dans la distance de Kolmogorov. Toutefois, si la distribution limite est continue, cette pathologie ne se produit pas. )
Du point de vue de la probabilité élémentaire ou de la théorie de la mesure, 1. est très naturel car il compare les probabilités d'être dans un ensemble. En revanche, une perspective probabiliste plus sophistiquée tend à se concentrer davantage sur les attentes que sur les probabilités. En outre, du point de vue de l'analyse fonctionnelle, des distances telles que 2. ou 3. basées sur la dualité avec un espace fonctionnel sont très attrayantes, car il existe un grand nombre d'outils mathématiques pour travailler avec ce genre de choses.
Cependant, mon impression (corrigez-moi si je me trompe!) Est que, dans les statistiques, la distance de Kolmogorov est le moyen généralement préféré de mesurer la similarité des distributions. Je peux deviner une des raisons: si l’une des distributions est discrète avec un support fini - en particulier s’il s’agit de la distribution de données réelles - alors la distance de Kolmogorov par rapport à une distribution de modèle est facile à calculer. (La distance KR serait légèrement plus difficile à calculer, et la distance BL serait probablement impossible en pratique.)
Ma question (enfin) est donc la suivante: existe-t-il d'autres raisons, pratiques ou théoriques, de favoriser la distance de Kolmogorov (ou une autre distance) à des fins statistiques?