En essayant de faire par exemple une classification, mon approche est actuellement de
- essayez d'abord différents algorithmes et comparez-les
- effectuer la sélection des fonctionnalités sur le meilleur algorithme parmi 1
- régler les paramètres en utilisant les fonctionnalités et l'algorithme sélectionnés
Cependant, je ne peux souvent pas me convaincre qu'il peut y avoir un meilleur algorithme que celui sélectionné, si les autres algorithmes ont été optimisés avec le meilleur paramètre / les fonctionnalités les plus appropriées. Dans le même temps, faire une recherche dans tous les algorithmes * paramètres * fonctionnalités prend trop de temps.
Une suggestion sur la bonne approche / séquence?
méthode CV n'est impartiale que si toute la construction de votre modèle est effectuée à l'intérieur de la boucle CV. Il en va de même pour la sélection des fonctionnalités dans la boucle CV pour le réglage des paramètres. Cela peut être fait facilement en utilisant l'enveloppe de filtre dans le package MLR dans R.