Les moyennes micro et macro (quelle que soit la métrique) calculent des choses légèrement différentes, et donc leur interprétation diffère. Une macro-moyenne calcule la métrique indépendamment pour chaque classe, puis prend la moyenne (donc toutes les classes sont traitées de manière égale), tandis qu'une micro-moyenne agrégera les contributions de toutes les classes pour calculer la métrique moyenne. Dans une configuration de classification à plusieurs classes, la micro-moyenne est préférable si vous suspectez un déséquilibre entre les classes (vous pouvez donc avoir beaucoup plus d'exemples d'une classe que d'autres classes).
Pour illustrer pourquoi, prenons par exemple la précision . Imaginons que vous disposiez d'unsystème de classification multi-classesOne-vs-All(il n'y a qu'une seule sortie de classe correcte par exemple) avec quatre classes et les nombres suivants lors du test:Pr = TP( TP+ FP)
- Classe A: 1 TP et 1 PF
- Classe B: 10 TP et 90 FP
- Classe C: 1 TP et 1 FP
- Classe D: 1 TP et 1 FP
Vous pouvez voir facilement que , alors que P r B = 0,1 .PrUNE= PrC= Prré= 0.5PrB= 0,1
- Une macro moyenne calculera alors: Pr = 0,5 + 0,1 + 0,5 + 0,54= 0.4
- Une micro-moyenne calculera: Pr = 1 + 10 + 1 + 12 + 100 + 2 + 2= 0,123
Ce sont des valeurs assez différentes pour la précision. Intuitivement, dans la moyenne macro-économique, la "bonne" précision (0,5) des classes A, C et D contribue à maintenir une précision globale "décente" (0,4). Bien que cela soit techniquement vrai (précision moyenne de 0,4 pour toutes les classes), cela est un peu trompeur, puisqu'un grand nombre d'exemples ne sont pas correctement classés. Ces exemples correspondent principalement à la classe B, ils ne contribuent donc qu’à un quart de la moyenne malgré qu’ils constituent 94,3% de vos données de test. La micro-moyenne capturera correctement ce déséquilibre de classe et ramènera la moyenne de précision globale à 0,123 (plus conforme à la précision de la classe dominante B (0.1)).
Pour des raisons de calcul, il peut parfois être plus pratique de calculer des moyennes de classe puis de les calculer en moyenne. Si l’on sait que le déséquilibre entre les classes est un problème, il existe plusieurs façons de le contourner. L'une consiste à indiquer non seulement la moyenne macro, mais également son écart type (pour 3 classes ou plus). Une autre consiste à calculer une macro-moyenne pondérée, dans laquelle chaque contribution de classe à la moyenne est pondérée par le nombre relatif d’exemples disponibles. Dans le scénario ci-dessus, nous obtenons:
Prm a c r o - m e un n= 0,25 ⋅ 0,5 + 0,25 ⋅ 0,1 + 0,25 ⋅ 0,5 + 0,25 ⋅ 0,5 = 0,4
Prm a c r o - s t de v= 0,173
Prm a c r o - w e i gh t e d= 0,0189 ⋅ 0,5 + 0,943 ⋅ 0,1 + 0,0189 ⋅ 0,5 + 0,0189 ⋅ 0,5= 0,009 + 0,094 + 0,009 + 0,009 = 0,123
L’écart type élevé (0,173) nous indique déjà que la moyenne de 0,4 ne découle pas d’une précision uniforme entre les classes, mais il pourrait être simplement plus facile de calculer la moyenne macro pondérée, ce qui est essentiellement une autre façon de calculer la moyenne moyenne. .