La régression Bayesian Ridge est-elle un autre nom de la régression linéaire bayésienne?


11

J'ai cherché sur la régression Bayesian Ridge sur Internet, mais la plupart du résultat que je suis devenu concerne la régression linéaire bayésienne. Je me demande si ce sont les deux mêmes choses parce que la formule est assez similaire

Réponses:


20

La régression de crête utilise la régularisation avecL2La norme, tandis que la régression bayésienne , est un modèle de régression défini en termes probabilistes, avec des a priori explicites sur les paramètres. Le choix des a priori peut avoir un effet de régularisation, par exemple, utiliser les a priori de Laplace pour les coefficients équivaut àL1régularisation . Ce ne sont pas les mêmes, car la régression des crêtes est une sorte de modèle de régression et l'approche bayésienne est un moyen général de définir et d'estimer des modèles statistiques qui peuvent être appliqués à différents modèles.

Le modèle de régression de crête est défini comme

unergmjenβy-Xβ22+λβ22

En milieu bayésien, nous estimons la distribution postérieure en utilisant le théorème de Bayes

p(θ|X)p(X|θ)p(θ)

La régression de crête signifie supposer une vraisemblance normale et une priorité normale pour les paramètres. Après avoir baissé la constante de normalisation, la fonction de densité logarithmique de la distribution normale est

Journalp(X|μ,σ)=Journal[1σ2πe-12(X-μσ)2]=Journal[1σ2π]+Journal[e-12(X-μσ)2]-12(X-μσ)2-1σ2X-μ22

Vous pouvez maintenant voir que maximiser la probabilité de log normale, avec des a priori normaux, équivaut à minimiser la perte au carré, avec une pénalité de crête

argmaxβlogN(y|Xβ,σ)+logN(0,τ)=argminβ{logN(y|Xβ,σ)+logN(0,τ)}=argminβ1σ2yXβ22+1τ2β22

Pour en savoir plus sur la régression et la régularisation des crêtes, voir les discussions: Pourquoi l'estimation des crêtes devient-elle meilleure que l'OLS en ajoutant une constante à la diagonale? et Quel problème les méthodes de retrait résolvent-elles? , et quand dois-je utiliser lasso vs ridge? et pourquoi la régression des crêtes est-elle appelée "crête", pourquoi est-elle nécessaire et que se passe-t-il lorsque passe à l'infini? λ, et bien d'autres que nous avons .


Merci d'avoir répondu ! j'ai essayé de comprendre quels sont les avantages de la norme , l'explication sur Scikit est un peu compliquée pour moi. Ce serait bien si vous pouviez signaler le problème avec les moindres carrés ordinaires ordinairesL2
Thien

1
@Thien voir l'édition pour certains liens
Tim
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.