Existe-t-il une stratégie pour choisir le nombre d'arbres dans un GBM? Plus précisément, l' ntrees
argument dans R
la gbm
fonction de.
Je ne vois pas pourquoi vous ne devriez pas définir ntrees
la valeur raisonnable la plus élevée. J'ai remarqué qu'un plus grand nombre d'arbres réduit clairement la variabilité des résultats de plusieurs GBM. Je ne pense pas qu'un nombre élevé d'arbres conduirait à un sur-ajustement.
Des pensées?