Modèles génératifs vs discriminants (dans le contexte bayésien)

22

Quelles sont les différences entre les modèles génératifs et discriminants (discriminants) (dans le contexte de l'apprentissage et de l'inférence bayésienne)?

et qu'est-ce qui concerne la prédiction, la théorie de la décision ou l'apprentissage sans supervision?

bayesian predictive-models unsupervised-learning

— nkint
source

Désolé, je ne comprends pas ce que vous entendez par la deuxième phrase. Souhaitez-vous essayer de le reformuler?

— csgillespie

ohu, je viens de rejoindre le monde de la statistique et de l'apprentissage automatique, désolé de ne pas avoir su comment lier l'apprentissage non supervisé à la théorie de la décision. mais j'étudie toujours!

— nkint

1

Je suis juste confus de voir comment cela s'intègre à la question. Par exemple, les mots "prédiction", "théorie de la décision" ou "sans surveillance" n'apparaissent pas dans la réponse acceptée

— csgillespie

35

Les deux sont utilisés dans l'apprentissage supervisé où vous voulez apprendre une règle qui mappe l'entrée x à la sortie y, étant donné un certain nombre d'exemples d'apprentissage de la forme . Un modèle génératif (par exemple, Bayes naïf) modélise explicitement la distribution de probabilité conjointe puis utilise la règle de Bayes pour calculer . D'un autre côté, un modèle discriminant (par exemple, la régression logistique) modélise directement . $\{(x_i,y_i)\}$ $p(x,y)$ $p(y|x)$ $p(y|x)$

Certaines personnes soutiennent que le modèle discriminant est meilleur dans le sens où il modélise directement la quantité qui vous intéresse , vous n'avez donc pas à consacrer vos efforts de modélisation à l'entrée x (vous devez calculer ainsi que dans un modèle génératif). Cependant, le modèle génératif a ses propres avantages tels que la capacité de traitement des données manquantes, etc. Pour une comparaison, vous pouvez jeter un oeil à cet article: Sur discriminante par rapport à génératives classificateurs: comparaison A de la régression logistique et Naive Bayes $(y)$ $p(x|y)$

Il peut y avoir des cas où un modèle est meilleur que l'autre (par exemple, les modèles discriminants ont généralement tendance à faire mieux si vous avez beaucoup de données; les modèles génératifs peuvent être meilleurs si vous avez des données supplémentaires sans étiquette). En fait, il existe également des modèles hybird qui essaient d'apporter le meilleur des deux mondes. Voir cet article pour un exemple: hybrides de principe de modèles génératifs et discriminants

— ébène1
source

2

Bonne réponse. En ce qui concerne la comparaison d'exemples canoniques de classificateurs discriminatifs vs génératifs (régression logistique et Bayes naïfs gaussiennes respectivement), j'ai trouvé ce chapitre de livre très accessible que le Ng: cs.cmu.edu/~tom/mlbook/NBayesLogReg.pdf

— Josh Hemann

4

Un ajout à la réponse ci-dessus:

Étant donné que le discriminant ne se soucie que de P (Y | X), tandis que le générateur se soucie de P (X, Y) et de P (X) en même temps, afin de bien prédire P (Y | X), le modèle génératif a moins de degré de liberté dans le modèle par rapport au modèle discriminant. Le modèle génératif est donc plus robuste , moins sujet au sur-ajustement, tandis que la discrimination est l'inverse.

Cela explique la réponse ci-dessus

Il peut y avoir des cas où un modèle est meilleur que l'autre (par exemple, les modèles discriminants ont généralement tendance à faire mieux si vous avez beaucoup de données; les modèles génératifs peuvent être meilleurs si vous avez des données supplémentaires sans étiquette).

— Intelligence artificielle
source

2

Pouvez-vous expliquer ce que vous dites sur le fait que les modèles génératifs ont moins de degrés de liberté? Preuve? Liens? Merci

— Patrick

@Patrick "Votre classifieur est secrètement un modèle basé sur l'énergie ..." (Grathwol et al., 2019) en donne un exemple concret: la perte d'entropie croisée est invariante aux logits changeants, et ils suppriment ce degré de liberté pour convertir des modèles discriminants en modèles génératifs basés sur l'énergie. Mais ArtificiallyIntelligence aurait peut-être une meilleure source.

— Christabella Irwanto Il y a