Pourquoi la mesure F est-elle généralement utilisée pour les tâches de classification (supervisées), alors que la mesure G (ou indice de Fowlkes – Mallows) est généralement utilisée pour les tâches de regroupement (non supervisées)?
La mesure F est la moyenne harmonique de la précision et du rappel .
La mesure G (ou indice de Fowlkes – Mallows) est la moyenne géométrique de la précision et du rappel .
Vous trouverez ci-dessous un graphique des différents moyens.
F1 (harmonique)
Géométrique
Arithmétique
La raison pour laquelle je demande est que je dois décider quelle moyenne utiliser dans une tâche NLG, où j'ai mesuré BLEU et ROUGE (où BLEU est équivalent à la précision et ROUGE à rappeler). Comment dois-je calculer la moyenne de ces scores?