Précision moyenne et rappel lors de l'utilisation de la validation croisée


11

J'ai effectué une classification en utilisant plusieurs classificateurs pour des données étiquetées à 2 classes, et j'ai utilisé une validation croisée 5 fois. Pour chaque pli, j'ai calculé tp, tn, fp et fn. Ensuite, j'ai calculé l'exactitude, la précision, le rappel et le score F pour chaque test. Ma question est la suivante: lorsque je veux faire la moyenne des résultats, j'ai pris la moyenne des précisions, mais puis-je également faire la moyenne de la précision, du rappel et du score F? Ou serait-ce mathématiquement incorrect? PS Les jeux de données utilisés dans chaque pli sont bien équilibrés en termes de nombre d'instances par classe.

Merci.


3
J'ai rencontré votre même problème concernant le calcul de la mesure F (moyenne harmonique de précision et de rappel) en utilisant la validation croisée. Dans cet article, ils ont en fait démontré que le calcul de la mesure F sur l'ensemble complet, et non la moyenne, est la méthode la moins biaisée. J'espère que cela peut aider
papafe

3
@markusian Veuillez ajouter ceci comme réponse! C'est de loin la chose la plus importante sur cette page !!
drevicko

Réponses:


2

F

F1=2precisionrecallprecision+recall
Fββ
Fβ=(1+β2)precisionrecall(β2precision)+recall
F

tFF


Oui, j'ai utilisé la première formule. Cela signifie que la moyenne du score F des différents tests donne des résultats similaires à la moyenne de précision et de rappel, puis le calcul du score F à partir d'eux. J'ai essayé cela sur les résultats que j'ai et c'était presque la même chose. Merci.
Kalaji
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.