Mon texte non paramétrique, Statistiques pratiques non paramétriques , donne souvent des formules claires pour les attentes, les variances, les statistiques de test, etc., mais inclut la mise en garde que cela ne fonctionne que si nous ignorons les liens. Lors du calcul de la statistique U de Mann-Whitney, il est recommandé de jeter les paires liées lors de la comparaison de la plus grande.
Je comprends que les liens ne nous disent pas vraiment grand-chose sur quelle population est plus grande (si c'est ce qui nous intéresse) car aucun groupe n'est plus grand que l'autre, mais il ne semble pas que cela importerait lors du développement de distributions asymptotiques.
Pourquoi alors est-ce un tel dilemme de traiter les liens dans certaines procédures non paramétriques? Existe-t-il un moyen d'extraire des informations utiles des liens, plutôt que de simplement les jeter?
EDIT: En ce qui concerne le commentaire de @ whuber, j'ai vérifié à nouveau mes sources, et certaines procédures utilisent une moyenne de rangs au lieu de supprimer complètement les valeurs liées. Bien que cela semble plus judicieux en ce qui concerne la conservation des informations, il me semble également que cela manque de rigueur. L'esprit de la question subsiste cependant.