Considérons l'équation linéaire
et le SVD de ,
où est la matrice diagonale des valeurs singulières.X β= y,
XX = USVT,
S =diag( sje)
Les moindres carrés ordinaires déterminent le vecteur de paramètres as
Cependant, cette approche échoue dès qu'il y a une valeur singulière qui est zéro (car alors l'inverse n'existe pas). De plus, même si aucun n'est excessivement nul, des valeurs singulières numériquement petites peuvent rendre la matrice mal conditionnée et conduire à une solution qui est très sensible aux erreurs.ββO L S= VS- 1UT
sje
La régression de crête et l'ACP présentent deux méthodes pour éviter ces problèmes. La régression des crêtes remplace dans l'équation ci-dessus pour par
S- 1βS-1crêteβcrête= diag ( sjes2je+ α) ,= V S- 1crêteUT
PCA remplace par
wehre est la fonction pas à pas et est le paramètre de seuil.S- 1S- 1PCAβPCA= diag ( 1sjeθ ( sje- γ) ),= V S- 1PCAUT
θγ
Les deux méthodes affaiblissent ainsi l'impact des sous-espaces correspondant aux petites valeurs. PCA fait cela de manière difficile, tandis que la crête est une approche plus fluide.
Plus abstraitement, n'hésitez pas à créer votre propre schéma de régularisation
où est une fonction qui devrait approcher zéro pour et pour large. Mais rappelez-vous, il n'y a pas de déjeuner gratuit.S- 1myReg= diag ( R ( sje) ),
R ( x )x → 0R ( x ) → x- 1X