Pour une partie d'une question de devoirs, on m'a demandé de calculer la moyenne ajustée pour un ensemble de données en supprimant l'observation la plus petite et la plus grande, et d'interpréter le résultat. La moyenne ajustée était inférieure à la moyenne non ajustée.
Mon interprétation était que c'était parce que la distribution sous-jacente était positivement asymétrique, donc la queue gauche est plus dense que la queue droite. En raison de cette asymétrie, la suppression d'une donnée élevée entraîne la moyenne plus vers le bas que la suppression d'une valeur basse la pousse vers le haut, car, de manière informelle, il y a plus de données faibles "attendant de prendre sa place". (Est-ce raisonnable?)
Ensuite, j'ai commencé à me demander comment le pourcentage d'ajustement affecte cela, j'ai donc calculé la moyenne ajustée pour divers . J'ai une forme parabolique intéressante: k=1/n,2/n,…,(n
Je ne sais pas trop comment interpréter cela. Intuitivement, il semble que la pente du graphique devrait être (proportionnelle à) l'asymétrie négative de la partie de la distribution à l'intérieur de points de données de la médiane. (Cette hypothèse vérifie mes données, mais je n'ai que , donc je ne suis pas très confiant.)n = 11
Ce type de graphique a-t-il un nom ou est-il couramment utilisé? Quelles informations pouvons-nous tirer de ce graphique? Y a-t-il une interprétation standard?
Pour référence, les données sont: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80.