Cet article suit celui-ci: pourquoi l'estimation des crêtes devient-elle meilleure que l'OLS en ajoutant une constante à la diagonale?
Voici ma question:
Pour autant que je sache, la régularisation des crêtes utilise une norme (distance euclidienne). Mais pourquoi utilisons-nous le carré de cette norme? (une application directe de résulterait de la racine carrée de la somme des beta au carré).
À titre de comparaison, nous ne faisons pas cela pour le LASSO, qui utilise une norme pour régulariser. Mais ici, c'est la norme "réelle" (juste la somme du carré des valeurs absolues bêta, et non le carré de cette somme).
Quelqu'un peut-il m'aider à clarifier?