Winsoriser les données signifie remplacer les valeurs extrêmes d'un ensemble de données par une certaine valeur de centile à chaque extrémité, tandis que le rognage ou la troncature implique la suppression de ces valeurs extrêmes.
Je vois toujours les deux méthodes discutées comme une option viable pour atténuer l'effet des valeurs aberrantes lors du calcul de statistiques telles que la moyenne ou l'écart-type, mais je n'ai pas vu pourquoi on pourrait choisir l'une plutôt que l'autre.
Y a-t-il des avantages ou des inconvénients relatifs à l'utilisation du Winsorizing ou du Trimming? Y a-t-il certaines situations où une méthode serait préférable? Est-on utilisé plus souvent dans la pratique ou sont-ils fondamentalement interchangeables?