J'essaie de créer un modèle réduit pour prédire de nombreuses variables dépendantes (DV) (~ 450) qui sont hautement corrélées.
Mes variables indépendantes (IV) sont également nombreuses (~ 2000) et fortement corrélées.
Si j'utilise le lasso pour sélectionner un modèle réduit pour chaque sortie individuellement, je ne suis pas assuré d'obtenir le même sous-ensemble de variables indépendantes que je boucle sur chaque variable dépendante.
Existe-t-il une régression linéaire multivariée qui utilise le lasso dans R?
Ce n'est pas du lasso de groupe. lasso de groupe regroupe le IV. Je veux une régression linéaire multivariée (ce qui signifie que le DV est une matrice, pas un vecteur de scalaires), qui implémente également le lasso. (Remarque: comme le souligne la NRH, ce n'est pas vrai. Le lasso de groupe est un terme général qui inclut des stratégies qui regroupent le IV, mais également des stratégies qui regroupent d'autres paramètres tels que le DV)
J'ai trouvé ce document qui entre dans quelque chose appelé Lasso à superposition clairsemée Lasso
Voici un code qui fait une régression linéaire multivariée
> dim(target)
[1] 6060 441
> dim(dictionary)
[1] 6060 2030
> fit = lm(target~dictionary)
Voici un code qui fait du lasso sur un seul DV
> fit = glmnet(dictionary, target[,1])
Et voici ce que je voudrais faire:
> fit = glmnet(dictionary, target)
Error in weighted.mean.default(y, weights) :
'x' and 'w' must have the same length
Sélection de fonctionnalités adaptées à TOUTES les cibles à la fois
glmnet
et il a une vignette complète.