En régression linéaire, pourquoi la régularisation pénalise-t-elle également les valeurs des paramètres?


9

J'apprends actuellement la régression des crêtes et j'étais un peu confus au sujet de la pénalisation des modèles plus complexes (ou de la définition d'un modèle plus complexe).

D'après ce que je comprends, la complexité du modèle n'est pas nécessairement en corrélation avec l'ordre polynomial. Donc:

2+3+4X2+5X3+6X4
est un modèle plus complexe que:
5X5

Et je sais que le point de régularisation est de maintenir la complexité du modèle faible, alors disons par exemple que nous avons un polynôme de cinquième ordre

F(X;w)=w0+w1X+w2X2+w3X3+w4X4+w5X5

Plus il y a de paramètres à 0, mieux c'est.

Mais ce que je ne comprends pas, c'est que si c'était le même polynôme d'ordre, pourquoi les valeurs de paramètres inférieures sont-elles moins pénalisées? Alors pourquoi:

2+5X+X3

433+342X+323X3

Je vous remercie!

Réponses:


10

les valeurs des paramètres dépendent simplement des données

C'est l'élément clé de votre question. C'est là que vous êtes confus.

Oui, les valeurs des paramètres dépendent des données. Mais les données sont fixes lorsque nous ajustons un modèle. En d'autres termes, nous ajustons un modèle conditionnel aux observations . Il n'est pas logique de comparer la complexité de différents modèles qui ont été adaptés à différents ensembles de données .

Et dans le contexte d'un ensemble de données fixe, un modèle

2+5X+X3

est en effet plus proche du modèle le plus simple possible, à savoir le modèle zéro plat, que

433+342X+323X3,

et cela vaut quelle que soit l'échelle de vos observations.

24332433


1
Les coefficients d'amplitude inférieurs sont plus éloignés du zéro plat que les coefficients supérieurs? Est-ce une faute de frappe, ou est-ce que je comprends mal pourquoi un modèle plus éloigné de la constante n'est pas autant pénalisé qu'un modèle plus proche de la constante?
RM

Désolé, c'était bien une faute de frappe. Laisse moi éditer. Merci de l'avoir signalé!
Stephan Kolassa
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.