Je travaille actuellement sur la construction d'un modèle prédictif pour un résultat binaire sur un ensemble de données avec environ 300 variables et 800 observations. J'ai beaucoup lu sur ce site sur les problèmes liés à la régression pas à pas et pourquoi ne pas l'utiliser.
J'ai lu la régression LASSO et sa capacité de sélection de fonctionnalités et j'ai réussi à l'implémenter avec l'utilisation du package "caret" et de "glmnet".
Je suis capable d'extraire le coefficient du modèle avec l'optimal lambda
et alpha
de "caret"; cependant, je ne sais pas comment interpréter les coefficients.
- Les coefficients LASSO sont-ils interprétés selon la même méthode que la régression logistique?
- Serait-il approprié d'utiliser les caractéristiques sélectionnées de LASSO dans la régression logistique?
ÉDITER
Interprétation des coefficients, comme dans les coefficients exponentiels de la régression LASSO comme les cotes logarithmiques pour un changement de 1 unité du coefficient tout en maintenant tous les autres coefficients constants.