Question: Quels sont les avantages / inconvénients d'utiliser l'un avant l'autre pour la sélection des variables?
Supposons que j'ai la probabilité: où je peux mettre l' un des prieurs: ou: w i ∼ π δ 0 + ( 1 - π ) N ( 0 , 100 )
J'ai mis pour souligner que la plupart des poids sont nuls et un gamma avant pour choisir le paramètre de «régularisation».λ
Cependant, mon professeur continue d'insister sur le fait que la version au lasso «rétrécit» les coefficients et ne fait pas en fait une sélection appropriée des variables, c'est-à-dire qu'il y a un rétrécissement même des paramètres pertinents.
Personnellement, je trouve la mise en œuvre de la version Lasso plus facile car j'utilise des Bayes variationnels. En fait, le document d' apprentissage bayésien clairsemé qui met effectivement un a priori de donne des solutions encore plus rares.