Dans mon travail, lorsque les individus se réfèrent à la valeur "moyenne" d'un ensemble de données, ils se réfèrent généralement à la moyenne arithmétique (c'est-à-dire "moyenne" ou "valeur attendue"). Si j'ai fourni le moyenne géométrique , les gens penseraient probablement que je suis sournois ou inutile, car la définition de «moyenne» est connue à l'avance.
J'essaie de déterminer s'il existe plusieurs définitions de la "médiane" d'un ensemble de données. Par exemple, l'une des définitions fournies par un collègue pour trouver la médiane d'un ensemble de données avec un nombre pair d'éléments serait:
Algorithme 'A'
- Divisez le nombre d'éléments par deux, arrondissez vers le bas.
- Cette valeur est l'indice de la médiane.
- ie pour l'ensemble suivant, la médiane serait
5
. [4, 5, 6, 7]
Cela semble logique, même si l'aspect arrondi semble un peu arbitraire.
Algorithme «B»
Dans tous les cas, un autre collègue a proposé un algorithme distinct, qui se trouvait dans un manuel de statistiques de son (besoin d'obtenir le nom et l'auteur):
- Divisez le nombre d'éléments par 2 et conservez une copie des nombres entiers arrondis et arrondis. Nommez-les
n_lo
etn_hi
. - Prenez la moyenne arithmétique des éléments en
n_lo
etn_hi
. - ie pour l'ensemble suivant, la médiane serait
(5+6)/2 = 5.5
. [4, 5, 6, 7]
Cela semble cependant faux, car la valeur médiane, 5.5
dans ce cas, n'est pas réellement dans l'ensemble de données d'origine. Lorsque nous avons remplacé l'algorithme «A» par «B» dans un code de test, il s'est cassé horriblement (comme nous nous y attendions).
Question
Existe-t-il un «nom» formel pour ces deux approches de calcul de la médiane d'un ensemble de données? c'est-à-dire «la médiane du moindre des deux» par rapport à la «médiane des éléments moyens et des nouvelles données»?