Je me sers de la quelques fois la validation croisée de d'évaluer la performance de certains algorithmes d'apprentissage, mais je l' ai toujours été perplexe quant à la façon dont je choisir la valeur de .
J'ai souvent vu et utilisé une valeur de , mais cela me semble totalement arbitraire et je viens maintenant d'utiliser par habitude au lieu de réfléchir. Il me semble que vous obtenez une meilleure granularité à mesure que vous améliorez la valeur de Idéalement, vous devriez donc donner à votre très grande valeur, mais il existe également un risque de partialité.
J'aimerais savoir sur quoi la valeur de devrait dépendre et comment je devrais réfléchir à cela lorsque j'évalue mon algorithme. Cela change-t-il quelque chose si j'utilise la version stratifiée de la validation croisée ou non?