Je me rends compte qu'il y a 3 paramètres de réglage dans le modèle de boosting trees, c'est-à-dire
- le nombre d'arbres (nombre d'itérations)
- paramètre de rétrécissement
- nombre de divisions (taille de chaque arbre constitutif)
Ma question est: pour chacun des paramètres de réglage, comment dois-je trouver sa valeur optimale? Et quelle méthode?
Notez que: le paramètre de rétrécissement et le paramètre nombre d'arbres fonctionnent ensemble, c'est-à-dire qu'une valeur plus petite pour le paramètre de rétrécissement conduit à une valeur plus élevée pour le nombre d'arbres. Et nous devons également en tenir compte.
Je suis particulièrement intéressé par la méthode pour trouver la valeur optimale pour le nombre de scissions. Doit-il être basé sur une validation croisée ou une connaissance du domaine sur le modèle derrière?
Et comment ces choses sont-elles effectuées dans le gbm
package en R?