TLDR:
Mon ensemble de données est assez petit (120) échantillons. Lors de la validation croisée 10 fois, dois-je:
Recueillir les résultats de chaque pli test, les concaténer en un vecteur, puis calculer l'erreur sur ce vecteur complet de prédictions (120 échantillons)?
Ou devrais-je plutôt calculer l'erreur sur les sorties que j'obtiens à chaque fois (avec 12 échantillons par pli), puis obtenir mon estimation d'erreur finale comme la moyenne des 10 erreurs d'erreur estimées?
Existe-t-il des articles scientifiques qui font valoir les différences entre ces techniques?
Contexte: Relation potentielle avec les scores macro / micro dans la classification multi-labels:
Je pense que cette question peut être liée à la différence entre les moyennes micro et macro qui sont souvent utilisées dans une tâche de classification multi-étiquettes (par exemple, disons 5 étiquettes).
Dans le cadre multi-étiquettes, les micro-scores moyens sont calculés en créant un tableau de contingence agrégé de vrais positifs, faux positifs, vrais négatifs, faux négatifs pour les 5 prédictions du classificateur sur 120 échantillons. Ce tableau de contingence est ensuite utilisé pour calculer la micro précision, le micro rappel et la micro f-mesure. Ainsi, lorsque nous avons 120 échantillons et cinq classificateurs, les micro-mesures sont calculées sur 600 prédictions (120 échantillons * 5 étiquettes).
Lors de l'utilisation de la variante Macro , on calcule les mesures (précision, rappel, etc.) indépendamment sur chaque étiquette et enfin, ces mesures sont moyennées.
L'idée derrière la différence entre les estimations micro et macro peut être étendue à ce qui peut être fait dans un paramètre K-fold dans un problème de classification binaire. Pour 10 fois, nous pouvons soit faire la moyenne de plus de 10 valeurs ( macro- mesure), soit concaténer les 10 expériences et calculer les micro- mesures.
Contexte - Exemple développé:
L'exemple suivant illustre la question. Disons que nous avons 12 échantillons de test et nous avons 10 plis:
- Pli 1 : TP = 4, FP = 0, TN = 8 Précision = 1,0
- Pli 2 : TP = 4, FP = 0, TN = 8 Précision = 1,0
- Pli 3 : TP = 4, FP = 0, TN = 8 Précision = 1,0
- Pli 4 : TP = 0, FP = 12, précision = 0
- Pli 5 .. Pli 10 : Tous ont le même TP = 0, FP = 12 et Precision = 0
où j'ai utilisé la notation suivante:
TP = # de vrais positifs, FP = # de faux positifs, TN = # de vrais négatifs
Les résultats sont:
- Précision moyenne sur 10 plis = 3/10 = 0,3
- Précision sur la concaténation des prédictions des 10 plis = TP / TP + FP = 12/12 + 84 = 0,125
Notez que les valeurs 0,3 et 0,125 sont très différentes !