Je semble mal comprendre une affirmation sur les méthodes de régression linéaire que j'ai vu à divers endroits. Les paramètres du problème sont:
Contribution:
échantillons de données de quantités constituées chacune d'une quantité de "réponse" et de quantités de "prédicteur"
Le résultat souhaité est un "bon ajustement linéaire" qui prédit la réponse sur la base des prédicteurs où un bon ajustement présente de petites différences entre la prédiction et la réponse observée (entre autres critères).
Sortie: coefficients où est un "bon ajustement" pour prédire la quantité de réponse à partir des quantités de prédicteur.
Je suis confus quant à l'approche de "régression de crête" à ce problème. Dans «The Elements of Statistical Learning» de Hastie, Tibshirani et Friedman page 63, la régression des crêtes est formulée de deux manières.
D'abord comme problème d' optimisation contraint :
Le deuxième est le problème d'optimisation pénalisé : pour un paramètre positif .
Le texte dit que ces formulations sont équivalentes et qu'il existe une "correspondance un à un entre les paramètres et ". J'ai vu cette affirmation (et d'autres similaires) à plusieurs endroits en plus de ce livre. Je pense que je manque quelque chose parce que je ne vois pas comment les formulations sont équivalentes si je comprends bien.
Considérons le cas où et avec , et , . En choisissant le paramètre la formulation contrainte devient:
étendu à
Pour résoudre ce problème, trouvez la solution où les dérivées partielles par rapport à et sont nulles: avec la solution et . Notez que comme requis.
Quel est le lien entre cette dérivation et l'autre formulation? Selon l'explication, il y a une certaine valeur de correspondant uniquement à où si nous optimisons la formulation pénalisée du problème, nous les mêmes et . Dans ce cas, la forme pénalisée devient étendu à Pour résoudre ce problème, trouvez la solution où les dérivées partielles avec par rapport à
En résumé, je suis totalement confus par les deux présentations et je ne comprends pas comment elles se correspondent. Je ne comprends pas comment vous pouvez optimiser un formulaire et obtenir la même solution pour l'autre formulaire ou comment est lié à . Ce n'est qu'un exemple de ce type de correspondance - il y en a d'autres pour d'autres approches comme le lasso - et je ne comprends aucune d'entre elles.
Quelqu'un, s'il vous plaît, aidez-moi.