J'ai des données multivariées sur la beauté par rapport aux âges. Les âges varient de 20 à 40 ans à des intervalles de 2 (20, 22, 24 ... 40), et pour chaque enregistrement de données, ils reçoivent un âge et une cote de beauté de 1 à 5. Lorsque je fais des boîtes à moustaches de ces données (âges sur l'axe X, cotes de beauté sur l'axe Y), il y a des valeurs aberrantes tracées en dehors des moustaches de chaque boîte.
Je souhaite supprimer ces valeurs aberrantes de la trame de données elle-même, mais je ne sais pas comment R calcule les valeurs aberrantes pour ses boîtes à moustaches. Voici un exemple de ce à quoi mes données pourraient ressembler.
boxplot
fonction renvoie les valeurs aberrantes (parmi d'autres statistiques) de manière invisible. Essayez defoo <- boxplot(...); foo
lire?boxplot
pour comprendre la sortie.