Je construis une régression logistique en R en utilisant la méthode LASSO avec les fonctions cv.glmnetpour sélectionner le lambdaet glmnetpour le modèle final.
Je connais déjà tous les inconvénients de la sélection automatique de modèle mais je dois quand même le faire.
Mon problème est que je dois inclure des variables factorielles (catégorielles) dans le modèle, y a-t-il un moyen de le faire sans créer beaucoup de variables fictives? Ces variables sont presque toutes des chaînes et non des nombres.