Quel «moyen» utiliser et quand?


197

Nous avons donc la moyenne arithmétique (AM), la moyenne géométrique (GM) et la moyenne harmonique (HM). Leur formulation mathématique est également bien connue, ainsi que leurs exemples stéréotypés associés (par exemple, la moyenne harmonique et son application aux problèmes liés à la «rapidité»).

Cependant, une question qui m’a toujours intriguée est la suivante: "Comment puis-je choisir le moyen le plus approprié dans un contexte donné?" Il doit y avoir au moins une règle de base pour aider à comprendre l'applicabilité et pourtant la réponse la plus courante que j'ai rencontrée est: "Cela dépend" (mais sur quoi?).

Cela peut sembler être une question plutôt triviale, mais même les textes des lycées ne l'ont pas expliqué - ils ne fournissent que des définitions mathématiques!

Je préfère une explication anglaise à une explication mathématique - un simple test serait: "est-ce que votre mère / votre enfant le comprendrait?"


20
Cela simplifie peut-être à l'excès, mais j'ai toujours utilisé la plage et les observations. Si la plage est la même = AM (comparez les scores 0-100 à 0-100), si la plage est différente mais que l'observation est la même = GM (comparez les scores 1-5 à 0-10), si la plage est la même mais les observations sont différents = HM (vitesse d'une voiture à différentes obs, hauteurs de deux échelles, autres "taux").
Brandon Bertelsen

> "Cela dépend" (mais sur quoi?) Cela dépend de l'algorithme de traitement des données.
Macson

Ce n'est pas simplement un choix de ce que signifie utiliser. C'est aussi un choix de quel ensemble de statistiques sommaires pour décrire la population ou le processus d'intérêt. Il ne faut pas penser que tout ce qui est nécessaire est un nombre unique pour décrire quelque chose d'une complexité peut-être énorme.
JimB

Réponses:


160

Cette réponse peut être légèrement plus mathématique que ce que vous recherchiez.

La chose importante à reconnaître est que tous ces moyens sont simplement le moyen arithmétique déguisé .

La caractéristique importante pour identifier lequel (le cas échéant) des trois moyens communs (arithmétique, géométrique ou harmonique) est le moyen "correct" consiste à trouver la "structure additive" dans la question à traiter.

En d'autres termes, supposons que nous recevions des quantités abstraites , que j'appellerai "mesures", abusant quelque peu de ce terme ci-dessous pour des raisons de cohérence. Chacune de ces trois moyennes peut être obtenue en (1) transformant chaque en une certaine , (2) en prenant la moyenne arithmétique , puis (3) en revenant à l’échelle de mesure initiale.x i y ix1,x2,,xnxiyi

Moyenne arithmétique : Nous utilisons évidemment la transformation "identité": . Ainsi, les étapes (1) et (3) sont triviales (rien n’est fait) et .ˉ x A M = ˉ yyi=xix¯AM=y¯

Moyenne géométrique : Ici, la structure additive est sur les logarithmes des observations originales. Donc, on prend et ensuite pour obtenir le GM à l'étape (3), on convertit via la fonction inverse du , c'est-à-dire, . connecte ˉ x G M = exp ( ˉ y )yi=logxilogx¯GM=exp(y¯)

Moyenne harmonique : Ici, la structure additive est sur les inverses de nos observations. Donc, , d’où .ˉ x H M = 1 / ˉ yyi=1/xix¯HM=1/y¯

Dans les problèmes physiques, cela survient souvent par le processus suivant: Nous avons une quantité qui reste fixe par rapport à nos mesures et quelques autres quantités, disons . Maintenant, nous jouons au jeu suivant: Gardons et constants et essayons de trouver des tels que si nous remplaçons chacune de nos observations individuelles par , la relation "totale" est toujours conservée .x 1 , ... , x n z 1 , ... , z n w z 1 + + z n ˉ x x i ˉ xwx1,,xnz1,,znwz1++znx¯xix¯

L'exemple distance – vélocité – temps semble être populaire, alors utilisons-le.

Distance constante, temps variables

Considérons une distance fixe parcourue . Supposons maintenant que nous parcourons cette distance fois à des vitesses différentes à la vitesse , en prenant les temps . Nous jouons maintenant à notre jeu. Supposons que nous voulions remplacer nos vitesses individuelles par une vitesse fixe telle que le temps total reste constant. Notez que nous avons sorte que . Nous voulons que cette relation totale (temps total et distance totale parcourue) soit conservée lorsque nous remplaçons chacun des par dans notre jeu. Par conséquent, n v 1 , , v n t 1 , , t n ˉ v d - v i t i = 0dnv1,,vnt1,,tnv¯

dviti=0,
i(dviti)=0viv¯
ndv¯iti=0,
et comme chaque , nous obtenons que ti=d/vi
v¯=n1v1++1vn=v¯HM.

Notez que la "structure additive" ici est relative aux temps individuels, et que nos mesures leur sont inversement liées, par conséquent la moyenne harmonique s’applique.

Distances variables, temps constant

Maintenant, changeons la situation. Supposons que, pour instances, nous parcourions un temps fixe vitesses sur des distances . Maintenant, nous voulons que la distance totale soit conservée. Nous avons et le système total est conservé si . Pour reprendre notre jeu, nous cherchons un tel que mais puisque , nous obtenons que ntv1,,vnd1,,dn

divit=0,
i(divit)=0v¯
i(div¯t)=0,
di=vit
v¯=1nivi=v¯AM.

Ici, la structure additive que nous essayons de maintenir est proportionnelle à nos mesures. La moyenne arithmétique s’applique.

Cube de volume égal

Supposons que nous ayons construit une boîte à dimensions avec un volume donné et que nous mesurions les longueurs latérales de la boîte. Ensuite, et supposons que nous voulions construire un (hyper) cube de dimension avec le même volume. En d’autres termes, nous souhaitons remplacer nos longueurs latérales individuelles par une longueur latérale commune . Alors nV

V=x1x2xn,
nxix¯
V=x¯x¯x¯=x¯n.

Cela indique facilement que nous devrions prendre .x¯=(xixn)1/n=x¯GM

Notez que la structure additive se trouve dans les logarithmes, c’est-à-dire et nous essayons de conserver la quantité de gauche.logV=ilogxi

Nouveau moyen de vieux

En tant qu'exercice, réfléchissez à ce que signifie "naturel" dans la situation où vous laissez les distances et les temps varier dans le premier exemple. C'est-à-dire que nous avons des distances , des vitesses et des temps . Nous voulons conserver la distance totale et le temps total parcouru et trouver une constante pour y parvenir.v i t i ˉ vdivitiv¯

Exercice : quelle est la signification "naturelle" de cette situation?


25
+1 C'est une excellente réponse. Cependant, je pense que c'est incomplet d'une manière importante: dans de nombreux cas, le bon moyen d'utiliser est déterminé par la question à laquelle nous essayons de répondre plutôt que par une structure mathématique dans les données. L'évaluation des risques pour l'environnement présente un bon exemple: les autorités de réglementation veulent estimer l'exposition totale d'une population à des contaminants au fil du temps. Cela nécessite une moyenne arithmétique pondérée de manière appropriée, même si les données de concentration environnementale ont généralement une structure multiplicative . La moyenne géométrique serait le mauvais estimateur ou estimand.
whuber

7
@whuber: (+1) C'est un excellent commentaire. Sur le chemin de la construction d’une réponse, j’ai pris une fourchette résolument non statistique, alors je suis heureux que vous en ayez parlé. C'est un sujet qui mérite une réponse complète ( indice ).
cardinal

9
@whuber: Cela évoque également le fait (peut-être involontairement) que l'analyse statistique peut souvent être soumise à la surveillance d'experts du domaine (ou même, dans votre exemple, même de non-experts), qui souhaitent estimer quelque chose de significatif pour leur domaine mais presque. tout à fait contre nature statistiquement. Le problème que j’ai rencontré dans le passé est qu’ils veulent parfois aussi dicter la manière dont l’estimation statistique est effectuée! :)
cardinal

1
@ Whuber: Ce serait très apprécié si vous pouviez également ajouter ce point de vue à la réponse, avec quelques précisions. Honnêtement, vos explications sont parmi les meilleures que j'ai vues dans Stats.SE!
Doctorat le

3
Le bon commentaire habituel de @whuber. Parfois (peut-être souvent!) Le bon sens à utiliser est inexistant ; au contraire, il faut souvent élargir la question à "quelle mesure de tendance centrale devrais-je utiliser?".
Peter Flom

43

En développant l'excellent commentaire de @Brandon (qui, selon moi, mérite d'être encouragé pour répondre):

La moyenne géométrique doit être utilisée lorsque vous vous intéressez aux différences multiplicatives. Brandon note que la moyenne géométrique devrait être utilisée lorsque les plages sont différentes. Ceci est généralement correct. La raison en est que nous voulons égaliser les gammes. Par exemple, supposons que les candidats à l’université soient notés sur la note SAT (0 à 800), la moyenne cumulative dans le SH (0 à 4) et les activités parascolaires (1 à 10). Si un collège souhaitait faire la moyenne de ces valeurs et égaliser les fourchettes (c'est-à-dire que le poids augmente dans chaque qualité par rapport à la fourchette), la moyenne géométrique serait la solution.

Mais ce n'est pas toujours vrai lorsque nous avons des échelles avec des gammes différentes. Si nous comparions le revenu dans différents pays (y compris les pays pauvres et les pays riches), nous ne voudrions probablement pas la moyenne géométrique, mais la moyenne arithmétique (ou, plus probablement, la médiane ou peut-être une moyenne ajustée).

La seule utilisation que je connaisse de la moyenne harmonique est celle de la comparaison des taux. Par exemple, si vous conduisez de New York à Boston à 40 km / h et que vous revenez à 60 km / h, votre moyenne générale n'est pas la moyenne arithmétique de 50 mi / h, mais la moyenne harmonique.

AM = HM =2 / ( 1 / 40 + 1 / 60 ) = 48(40+60)/2=502/(1/40+1/60)=48

pour vérifier que cela convient à cet exemple simple, imaginons qu’il s’agit de 120 miles entre New York et Boston. Ensuite, le trajet dure 3 heures, le trajet de retour dure 2 heures, le total est de 5 heures et la distance est de 240 miles. 240/5=48


3
Pourquoi votre exemple SAT / GPA / extrascolaire utilise-t-il une moyenne géométrique plutôt qu'une moyenne arithmétique pondérée ou mise à l'échelle? Pourquoi un SAT ou un GPA de zéro signifie-t-il que les deux autres valeurs deviennent non pertinentes (comme l'impliquerait une moyenne géométrique)? Et si (par exemple) des activités parascolaires ont tendance à se regrouper dans une bande beaucoup plus étroite que sa plage théorique? Il semble plus logique de prendre une moyenne arithmétique des centiles (ou d’autres valeurs ajustées) qu’une moyenne géométrique des valeurs brutes.
Ruakh

1
@ruakh Intéressant. Dans ce cas, le problème de 0 n'a pas d'importance, car SAT et GPA ne peuvent pas vraiment être 0 (SAT = 0 est presque impossible, et GPA de 0 ne serait pas diplômé). Je pense qu'une moyenne arithmétique des centiles sera proche de la moyenne géométrique dans ses conclusions (même si ce n'est pas dans les chiffres réels).
Peter Flom

31

Je vais essayer de résumer à 3-4 règles empiriques et de donner quelques exemples supplémentaires des moyens pythagoriciens.

La relation entre les 3 moyennes est HM <GM <AM pour les données non négatives avec certaines variations . Ils seront égaux si et seulement s'il n'y a aucune variation des données d'échantillon.

Pour les données en niveaux, utilisez le AM. Les prix sont un bon exemple. Pour les ratios, utilisez le GM. Les rendements des investissements, les prix relatifs tels que l'indice Bloomberg Billy (le prix de la bibliothèque Billy d'Ikea ​​dans différents pays par rapport au prix américain) et l'indice de développement humain des Nations Unies en sont tous des exemples. HM est approprié lorsqu'il s'agit de taux. Voici un exemple non-automobile de David Giles :

Par exemple, considérons les données sur "les heures travaillées par semaine" (un taux). Supposons que nous ayons quatre personnes (observations d'échantillons), chacune travaillant 2 000 heures au total. Cependant, ils travaillent pour un nombre différent d'heures par semaine, comme suit:

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

La moyenne arithmétique des valeurs de la troisième colonne est AM = 42,5 heures par semaine. Cependant, remarquez ce que cette valeur implique. En divisant le nombre total de semaines travaillées par les membres de l'échantillon (8 000) par cette valeur moyenne, on obtient une valeur de 188,2353, qui correspond au nombre total de semaines travaillées par les quatre personnes.

Maintenant, regardez la dernière colonne du tableau ci-dessus. En fait, la valeur correcte pour le nombre total de semaines travaillées par les membres de l'échantillon est 191,5873 semaines. Si nous calculons la moyenne harmonique pour les valeurs en heures par semaine dans la troisième colonne du tableau, nous obtenons HM = 41,75642 heures (<AM), et en divisant ce nombre par 8 000 heures, nous obtenons le résultat correct de 191,5873 pour le nombre total de semaines travaillées. Voici un cas où la moyenne harmonique fournit la mesure appropriée pour la moyenne de l'échantillon.

David discute également de la version pondérée des 3 moyennes, qui apparaissent dans les indices de prix utilisés pour mesurer l'inflation.

Un détournement à part:

Ces ROT ne sont pas parfaits. Par exemple, j'ai souvent du mal à comprendre si quelque chose est un taux ou un ratio. Les rendements d'un investissement sont généralement traités comme un ratio lors du calcul de la moyenne, mais ils constituent également un taux, car ils sont généralement libellés en "x% par unité de temps". Est-ce que "utiliser HM lorsque les données sont en niveaux par unité de temps" serait une meilleure heuristique?

Si vous vouliez résumer l’ indice Big Mac des pays d’Europe du Nord, utiliseriez-vous le GM?


3
Quelques années de retard, mais avez-vous déjà trouvé une réponse à votre question: "Si vous vouliez résumer l'indice Big Mac des pays du Nord de l'Europe, utiliseriez-vous le MJ?" ?
StatsScared

2
@StatsScared Nope, mais cela ferait une bonne question!
Dimitriy V. Masterov

7

Une réponse possible à votre question ("comment décider de la moyenne la plus appropriée dans un contexte donné?") Est la définition de la moyenne donnée par le mathématicien italien Oscar Chisini .

Voici un article avec une explication plus détaillée et quelques exemples (vitesse moyenne et autres).


6
L'idéal serait que vous ajoutiez quelques lignes sur la définition de Chisini au cas où le lien disparaîtrait, & / ou pour aider les lecteurs à savoir s'ils souhaitent cliquer sur le lien pour approfondir leurs idées.
gung

2
En effet, le lien vers le papier est mort. Le lien Wolfram ne donne aucune idée de la manière dont la définition de Chisini est utile pour déterminer quel moyen utiliser dans un contexte donné. il me semble que ce n'est qu'une généralisation mathématique, par opposition à une prescription d'utilisation.
Ryan Simmons

1
En utilisant le DOI, on peut voir que le papier a été déplacé vers tandfonline.com. Citation: R. Graziani, P. Veronese (2009). Comment calculer une moyenne? L'approche Chisini et ses applications. The American Statistician 63 (1), p. 33-36. tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf

0

Je pense qu'un moyen simple de répondre à la question serait:

  1. Si la structure mathématique est xy = k (une relation inverse entre variables) et que vous recherchez une moyenne, vous devez utiliser la moyenne harmonique - qui correspond à une moyenne arithmétique pondérée - considérez

Moyenne harmonique = 2ab / (a ​​+ b) = a (b / a + b) + b (a / (a ​​+ b)

Par exemple: la moyenne des coûts en dollars entre dans cette catégorie car le montant que vous investissez (A) reste fixe, mais le prix par action (P) et le nombre d'actions (N) varient (A = PN). En fait, si vous pensez à une moyenne arithmétique comme un nombre également centré entre deux nombres, la moyenne harmonique est également un nombre également centré entre deux nombres mais (et c'est bien beau) le "centre" est l'endroit où les pourcentages (ratios) sont égal. C'est-à-dire: (x - a) / a = (b -x) / b, où x est la moyenne harmonique.

  1. Si la structure mathématique est une variation directe y = kx, vous utilisez la moyenne arithmétique - ce à quoi la moyenne harmonique se réduit dans ce cas.

1
Je pense que vous devez vérifier que vos crochets correspondent dans votre équation moyenne harmonique - notez que vous pouvez utiliser le balisage Latex pour votre composition mathématique en l’entourant de signes dollar, par exemple, $x$produit . Pour les fractions noter que produit . Consultez notre aide à l'édition pour plus d'informations. ax\frac{a}{b}ab
Silverfish

Supposons que vous vouliez calculer la moyenne des probabilités de plusieurs modèles différents. Dans ce cas, est-il toujours judicieux d’utiliser un moyen géométrique ou harmonique?
thecity2
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.