J'utilise le package party en R avec 10 000 lignes et 34 fonctionnalités, et certaines fonctionnalités factorielles comportent plus de 300 niveaux. Le temps de calcul est trop long. (Cela a pris 3 heures jusqu'à présent et ce n'est pas fini.)
Je veux savoir quels éléments ont un effet important sur le temps de calcul d'une forêt aléatoire. Est-ce qu'il y a des facteurs avec trop de niveaux? Existe-t-il des méthodes optimisées pour améliorer le temps de calcul RF?