Comment le modèle linéaire généralisé généralise-t-il le modèle linéaire général?


8

De Wikipédia

Le modèle linéaire général (GLM) est un modèle linéaire statistique. Il peut être écrit comme 1 où est une matrice avec une série de mesures multivariées, est une matrice qui pourrait être une matrice de conception , est une matrice contenant des paramètres qui sont généralement à estimer et est une matrice contenant des erreurs ou du bruit. Les erreurs sont généralement supposées suivre une distribution normale multivariée.

Y=XB+U,
YXBU

Il dit ensuite

Si les erreurs ne suivent pas une distribution normale à plusieurs variables, les modèles linéaires généralisés peuvent être utilisés pour détendre les hypothèses sur et .YU

Je me demandais comment les modèles linéaires généralisés assouplissent les hypothèses sur et dans les modèles linéaires généraux?YU

Notez que je peux comprendre leur autre relation dans la direction opposée:

Le modèle linéaire général peut être considéré comme un cas du modèle linéaire généralisé avec lien d'identité.

Mais je doute que cela répondra à ma question.

Réponses:


10

Prenons un cas où votre variable de réponse est un ensemble de «succès» et «échecs» (également représentés par «oui» et «non», s et s, etc.). Si cela était vrai, il ne peut pas être le cas que votre terme d' erreur soit normalement distribué . Au lieu de cela, votre terme d'erreur serait par définition Bernoulli . Ainsi, l'une des hypothèses auxquelles il est fait allusion est violée. Une autre hypothèse de ce type est celle de l'homoscédasticité, mais elle serait également violée, car la variance est fonction de la moyenne. Nous pouvons donc voir que le GLM (OLS) est inapproprié dans ce cas. 10

Notez que, pour un modèle de régression linéaire typique, ce que vous (c'est-à-dire, ) est , la moyenne de la distribution normale conditionnelle de la réponse à l'endroit exact où . Ce dont nous avons besoin dans ce cas, c'est de prédire , la probabilité de «succès» à cet endroit. Nous considérons donc notre distribution de réponse comme Bernoulli, et nous prédisons le paramètre qui contrôle le comportement de cette distribution. Il y a cependant une complication importante ici. Plus précisément, il y aura des valeurs pour qui, en combinaison avec vos estimations produiront des valeurs prédites de (c'est-à-dire,y^iμiX=xiπ^iXβy^iπ^i) qui sera ou . Mais cela est impossible, car la plage de est . Nous devons donc transformer le paramètre afin qu'il puisse s'étendre , tout comme le côté droit de votre GLiM. Par conséquent, vous avez besoin d'une fonction de lien . <0>1π(0, 1)π(, )

À ce stade, nous avons stipulé une distribution de réponse (Bernoulli) et une fonction de lien (peut-être la transformation logit ). Nous avons déjà une partie structurelle de notre modèle: . Nous avons donc maintenant toutes les pièces nécessaires de notre modèle. Il s'agit maintenant du modèle linéaire généralisé, car nous avons «assoupli» les hypothèses concernant notre variable de réponse et les erreurs. Xβ

Pour répondre plus directement à vos questions spécifiques, le modèle linéaire généralisé assouplit les hypothèses sur et en proposant une distribution de réponse (dans la famille exponentielle ) et une fonction de lien qui mappe le paramètre en question à l'intervalle . YU(, )

Pour en savoir plus sur ce sujet, il peut vous être utile de lire ma réponse à cette question: Différence entre les modèles logit et probit .


(+1) Réponse concise et compréhensible.
COOLSerdash

Merci, gung! Dans les modèles linéaires généraux, "les erreurs sont généralement supposées suivre une distribution normale multivariée". Est-il exact que les modèles linéaires généraux ne sont pas nécessairement paramétriques dans le sens où ils ne spécifient pas entièrement la forme de la distribution de Y étant donné X? Parce qu'un modèle linéaire généralisé spécifie toujours la distribution de Y étant donné que X est une distribution de famille exponentielle, est-il exact qu'un modèle linéaire général peut ne pas être un modèle linéaire généralisé?
Tim

Non, le modèle linéaire général est entièrement spécifié; c'est toujours un cas particulier du modèle linéaire généralisé.
gung - Rétablir Monica

Est-ce que «les erreurs sont généralement supposées suivre une distribution normale multivariée» dans WIkipedia pour le modèle linéaire général signifie que l'erreur peut ne pas être normalement distribuée?
Tim
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.