Toutes mes excuses si c'est une question très basique.
Si nous avons des données qui ne sont pas normalement distribuées (par exemple asymétriques, le test de Shapiro-Wilk est significatif) et que nous recourons à des méthodes basées sur le classement (par exemple le test de Wilcoxon Signed Rank), devons-nous alors nous préoccuper des valeurs aberrantes?
Imaginez, par exemple, que nous traçons les données en utilisant un boxplot et une minorité de points de données sont marqués comme des valeurs aberrantes. Faut-il transformer ces points? Ou les supprimer? Il me semble que de nombreux manuels parlent de traitement des valeurs aberrantes, mais uniquement parce qu'ils exercent une influence majeure sur les paramètres tels que la moyenne et l'écart type. Cependant, lorsque nous utilisons un test basé sur le classement, ils seront déjà «transformés» pour être la prochaine valeur dans le classement, et n'exerceront donc pas une influence majeure sur le test. Je n'ai pas vu cela déclaré explicitement dans un livre de statistiques jusqu'à présent, j'ai donc pensé poser la question ici.
Avons-nous besoin de nous inquiéter des valeurs aberrantes lors de l'utilisation de tests basés sur le classement?