Pourquoi la perte de norme L2 a-t-elle une solution unique et la perte de norme L1 a-t-elle possiblement plusieurs solutions?


16

http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/

Si vous regardez en haut de cet article, l'auteur mentionne que la norme L2 a une solution unique et que la norme L1 a peut-être de nombreuses solutions. Je comprends cela en termes de régularisation, mais pas en termes d'utilisation de la norme L1 ou de la norme L2 dans la fonction de perte.

Si vous regardez les graphiques des fonctions de scalaire x (x ^ 2 et | x |), vous pouvez facilement voir que les deux ont une solution unique.


2
"fnx"? ... Veuillez modifier pour rendre cela plus clair. Voulez-vous dire "fonctions"?
Glen_b -Reinstate Monica

Réponses:


25

Considérons un problème unidimensionnel pour une exposition la plus simple possible. (Les cas de dimension supérieure ont des propriétés similaires.)

|xμ|(xμ)2i|xiμ|x1=1x2=3

Tracé de sum_i | x_i - mu |

μ

L1

i(xiμ)2=n(x¯μ)2+k(x)


L1

Étant donné que (en dehors de certaines circonstances spécifiques), vous n'avez généralement aucune garantie d'une telle absence d'observations hautement influentes, je ne dirais pas que la régression L1 est robuste.


Code R pour le tracé:

 fi <- function(x,i=0) abs(x-i)
 f <- function(x) fi(x,1)+fi(x,3)
 plot(f,-1,5,ylim=c(0,6),col="blue",lwd=2)
 curve(fi(x,1),-1,5,lty=3,col="dimgrey",add=TRUE)
 curve(fi(x,3),-1,5,lty=3,col="dimgrey",add=TRUE)

C'est bien. Quel logiciel avez-vous utilisé pour créer le graphique?
user3180

2
R. Cela se fait uniquement dans les graphiques de base. J'ai ajouté le code à la fin de ma réponse.
Glen_b -Reinstate Monica

1
Woah, je n'ai jamais réalisé que tu pouvais fournir une fonction plot. Je suis épaté.
JAD

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.