Soit le groupe qui vous intéresse; c'est-à-dire, que soit une partition de , où nous considérons qu'il y a fonctionnalités. Avec la réponse et la matrice de conception , l'estimateur de lasso de groupe estEn appliquant une autre pénalité au carré pour induire un retrait global, nous obtiendrions l'estimateurGG{1,…,p}py∈RnX∈Rn×p
argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2.
ℓ2argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ∥β∥22.
On pourrait appeler cela le "filet élastique de groupe". Par dualité lagrangienne, on peut écrire
argminβ∈Rp=argminβ∈Rp:∥β∥22≤C=argminβ∈Rp:∥β∥2≤C√=argminβ∈Rp=argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ∥β∥2212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ~∥β∥212n∥y−Xβ∥22+(λ∑g∈G|G|1/2∥βg∥2+μ~′p1/2∥β∥2),
où est la variable double correspondante et . Comme nous pouvons le voir, cette dernière expression est un lasso de groupe avec des groupes "se chevauchant", car n'est plus une partition. De plus, le groupe a une variable double (ou variable de réglage) qui est distincte de la variable double pour les autres groupes.
μ~μ~′=p−1/2μ~G∪{1,…,p}{1,…,p}μ~λ
Cela peut être un problème d'optimisation qui peut être résolu en utilisant le package gglasso
. La lecture de la section à la page 9 de la documentation ici vous renseignera sur la gglasso
fonction à utiliser. Notez que l'argument pmax
devra être fourni manuellement avec un dernier composant qui servira de paramètre de réglage.