Je veux éviter le sur-ajustement dans une forêt aléatoire. À cet égard, j'ai l'intention d'utiliser mtry, nodesize et maxnodes etc. Pourriez-vous s'il vous plaît m'aider à choisir des valeurs pour ces paramètres? J'utilise R.
Aussi, si possible, dites-moi comment je peux utiliser la validation croisée k-fold pour la forêt aléatoire (en R).