Interprétation de exp (B) dans la régression logistique multinomiale


16

C'est en quelque sorte une question de débutant, mais comment interpréter un résultat exp (B) de 6.012 dans un modèle de régression logistique multinomial?

1) est-ce 6,012-1,0 = 5,012 = 5012% d'augmentation du risque?

ou

2) 6,012 / (1 + 6,012) = 0,857 = 85,7% d'augmentation du risque?

Dans le cas où les deux alternatives sont incorrectes, quelqu'un peut-il indiquer la bonne façon?

J'ai recherché de nombreuses ressources sur Internet et j'arrive à ces deux alternatives, et je ne suis pas tout à fait sûr de celle qui est correcte.

Réponses:


35

Il nous faudra un certain temps pour y arriver, mais en résumé, un changement d'une unité dans la variable correspondant à B multipliera le risque relatif du résultat (par rapport au résultat de base) par 6,012.

On pourrait exprimer cela comme une augmentation de "5012%" du risque relatif , mais c'est une façon confuse et potentiellement trompeuse de le faire, car cela suggère que nous devrions penser aux changements de manière additive, alors qu'en fait le modèle logistique multinomial nous encourage fortement à pensez de manière multiplicative. Le modificateur «relatif» est essentiel, car un changement dans une variable modifie simultanément les probabilités prédites de tous les résultats, pas seulement celui en question, nous devons donc comparer les probabilités (au moyen de ratios, pas de différences).

Le reste de cette réponse développe la terminologie et l'intuition nécessaires pour interpréter correctement ces déclarations.

Contexte

Commençons par une régression logistique ordinaire avant de passer au cas multinomial.

Pour la variable dépendante (binaire) et les variables indépendantes , le modèle estX iOuiXje

Pr[Oui=1]=exp(β1X1++βmXm)1+exp(β1X1++βmXm);

de manière équivalente, en supposant ,0Pr[Oui=1]1

log(ρ(X1,,Xm))=logPr[Y=1]Pr[Y=0]=β1X1++βmXm.

(Cela définit simplement , qui est la cote en fonction du .)X iρXi

Sans aucune perte de généralité, le pour que soit la variable et soit le "B" dans la question (pour que ). Fixer les valeurs de et faire varier d'une petite quantité donneX m β m exp ( β m ) = 6,012 X i , 1 i < m X m δXiXmβmexp(βm)=6.012Xi,1i<mXmδ

log(ρ(,Xm+δ))log(ρ(,Xm))=βmδ.

Ainsi, est le changement marginal des cotes de log par rapport à .X mβm Xm

Pour récupérer , il faut évidemment définir et exposer le côté gauche:δ = 1exp(βm)δ=1

exp(βm)=exp(βm×1)=exp(Journal(ρ(,Xm+1))-Journal(ρ(,Xm)))=ρ(,Xm+1)ρ(,Xm).

Cela présente comme le rapport de cotes pour une augmentation d'une unité de . Pour développer une intuition de ce que cela pourrait signifier, tabulez quelques valeurs pour une plage de cotes de départ, en arrondissant fortement pour faire ressortir les modèles:X mexp(βm)Xm

Starting odds  Ending odds  Starting Pr[Y=1]  Ending Pr[Y=1]
0.0001         0.0006       0.0001            0.0006
0.001          0.006        0.001             0.006
0.01           0.06         0.01              0.057
0.1            0.6          0.091             0.38
1.             6.           0.5               0.9
10.            60.          0.91              1.
100.           600.         0.99              1.

Pour des cotes vraiment petites , qui correspondent à des probabilités très petites , l'effet d'une augmentation d'une unité dans est de multiplier les cotes ou la probabilité par environ 6,012. Le facteur multiplicatif diminue à mesure que les chances (et la probabilité) augmentent, et a essentiellement disparu une fois que les chances dépassent 10 (la probabilité dépasse 0,9).Xm

Changement de rapport de probabilité

En tant que changement additif , il n'y a pas beaucoup de différence entre une probabilité de 0,0001 et 0,0006 (c'est seulement 0,05%), pas plus qu'il n'y a beaucoup de différence entre 0,99 et 1. (seulement 1%). L'effet additif le plus important se produit lorsque les cotes sont égales à , où la probabilité passe de 29% à 71%: une variation de + 42%.1/6.0120,408

Changement additif de probabilité

Nous voyons donc que si nous exprimons le "risque" comme un rapport de cotes, = "B" a une interprétation simple - le rapport de cotes est égal à pour une augmentation d'unité de mais lorsque nous exprimons le risque dans certains d'une autre manière, comme un changement de probabilités, l'interprétation nécessite de préciser la probabilité de départ.β m X mβmβmXm

Régression logistique multinomiale

(Ceci a été ajouté en tant que modification ultérieure.)

Ayant reconnu la valeur de l'utilisation des cotes de log pour exprimer les chances, passons au cas multinomial. Maintenant, la variable dépendante peut être égale à l'une des catégories, indexées par . La probabilité relative qu'il se trouve dans la catégorie estk 2 i = 1 , 2 , , k iOuik2je=1,2,,kje

Pr[Yi]exp(β1(i)X1++βm(i)Xm)

avec les paramètres à déterminer et en écrivant pour . Comme abréviation, écrivons l'expression de droite comme ou, où et sont claires par rapport au contexte, simplement . Normaliser pour que toutes ces probabilités relatives soient égales à l'unité donne Y i Pr [ Y = catégorie  i ] p i ( X , β ) X β p iβj(i)YiPr[Y=category i]pi(X,β)Xβpi

Pr[Yi]=pi(X,β)p1(X,β)++pm(X,β).

(Il y a une ambiguïté dans les paramètres: ils sont trop nombreux. Classiquement, on choisit une catégorie "de base" pour comparaison et force tous ses coefficients à zéro. Cependant, bien que cela soit nécessaire pour rendre compte d'estimations uniques des bêtas, il n'est pas nécessaire d'interpréter les coefficients. Pour maintenir la symétrie - c'est-à-dire pour éviter toute distinction artificielle entre les catégories - n'appliquons pas une telle contrainte à moins que nous ne le soyons obligés.)

Une façon d'interpréter ce modèle consiste à demander le taux de variation marginal des cotes logarithmiques pour n'importe quelle catégorie (disons la catégorie ) par rapport à l'une quelconque des variables indépendantes (disons ). C'est-à-dire que lorsque nous modifions un peu, cela induit un changement dans les cotes logarithmiques de . Nous nous intéressons à la constante de proportionnalité reliant ces deux changements. La règle de chaîne du calcul, avec une petite algèbre, nous dit que ce taux de changement estX j X j Y iiXjXjYi

 journal des cotes(Ouije) Xj=βj(je)-βj(1)p1++βj(je-1)pje-1+βj(je+1)pje+1++βj(k)pkp1++pje-1+pje+1++pk.

Cela a une interprétation relativement simple comme le coefficient de dans la formule pour la chance que soit dans la catégorie moins un "ajustement". L'ajustement est la moyenne pondérée en fonction de la probabilité des coefficients de dans toutes les autres catégories . Les coefficients de pondération sont calculés en utilisant les probabilités associées aux valeurs courantes des variables indépendantes . Ainsi, la variation marginale des logs n'est pas nécessairement constante: elle dépend des probabilités de toutes les autres catégories, et pas seulement de la probabilité de la catégorie en question (catégorie ).βj(je) Y i X j X iXjOuijeXjXje

Lorsqu'il n'y a que catégories, cela devrait se réduire à une régression logistique ordinaire. En effet, la pondération de probabilité ne fait rien et (choisir ) donne simplement la différence . Laisser la catégorie être le cas de base le réduit encore à , car nous . Ainsi, la nouvelle interprétation généralise l'ancienne.i = 2 β ( 2 ) j - β ( 1 ) j i β ( 2 ) j β ( 1 ) j = 0k=2je=2βj(2)-βj(1)jeβj(2)βj(1)=0

Pour interpréter , nous allons donc l'isoler d'un côté de la formule précédente, conduisant à:βj(je)

Le coefficient de pour la catégorie est égal au changement marginal des cotes logarithmiques de la catégorie par rapport à la variable , plus la moyenne pondérée en fonction des probabilités des coefficients de tous les autres pour la catégorie .XjjejeXjXjje

Une autre interprétation, quoique un peu moins directe, est fournie en définissant (temporairement) la catégorie comme cas de base, ce qui rend pour toutes les variables indépendantes :jeβj(je)=0Xj

Le taux de variation marginal des cotes logarithmiques du cas de base pour la variable est le négatif de la moyenne pondérée en fonction de la probabilité de ses coefficients pour tous les autres cas.Xj

En fait, l'utilisation de ces interprétations nécessite généralement d'extraire les bêtas et les probabilités de la sortie du logiciel et d'effectuer les calculs comme indiqué.

Enfin, pour les coefficients exponentiels, notons que le rapport de probabilités entre deux résultats (parfois appelé le "risque relatif" de par rapport à ) estjeje

OuijeOuije=pje(X,β)pje(X,β).

Augmentons d'une unité à . Cela multiplie par et par , d'où le risque relatif est multiplié par = . Prendre la catégorie comme cas de base réduit cela à , ce qui nous amène à dire,X j + 1 p i exp ( β ( i ) j ) p i ' exp ( β ( i ) j ) exp (XjXj+1pjeexp(βj(je))pjeexp(βj(je))exp )exp(βj(je))/exp(βj(je))exp(βj(je)-βj(je))jeexp(βj(je))

Le coefficient exponentiellement est le montant par lequel le risque relatif est multiplié lorsque la variable est augmentée d'une unité.exp(βj(je))Pr[Oui=Catégorie je]/Pr[Oui=catégorie de base]Xj


1
Excellentes explications, mais l'OP a explicitement demandé le modèle multinomial . Je lis peut-être plus dans la question que le PO prévu, et l'explication du cas binaire peut être adéquate, mais j'aimerais que cette réponse couvre également le cas multinomial général. Même si la paramétrisation est similaire, les "log-odds" sont en général par rapport à une catégorie de référence (arbitraire), et ce ne sont pas vraiment des log-odds, et un changement d'unité dans entraîne un changement combiné de ces "log -odds ", et une augmentation des" log-odds "n'implique pas une probabilité croissante. Xje
NRH

@NRH C'est un excellent point. J'avais en quelque sorte lu "multivarié" au lieu de "multinomial". Si j'en ai l'occasion, j'essaierai d'étoffer ces détails. Heureusement, le même mode d'analyse est efficace pour trouver la bonne interprétation.
whuber

@NRH Terminé. Je me réjouis de vos suggestions (ou de toute autre personne) sur la façon de rendre l'interprétation plus claire, ou pour des interprétations alternatives.
whuber

1
merci d'avoir écrit ceci. La réponse complète est une très bonne référence.
NRH

1

Essayez de tenir compte de ce peu d'explication en plus de ce que @whuber a déjà si bien écrit. Si exp (B) = 6, alors le rapport de cotes associé à une augmentation de 1 sur le prédicteur en question est 6. Dans un contexte multinomial, par "rapport de cotes", nous entendons le rapport de ces deux quantités: a) les cotes ( pas la probabilité, mais plutôt p / [1-p]) d'un cas prenant la valeur de la variable dépendante indiquée dans le tableau de sortie en question, et b) les chances d'un cas prenant la valeur de référence de la variable dépendante.

Vous semblez chercher à quantifier la probabilité - plutôt que les probabilités - qu'un cas se trouve dans l'une ou l'autre catégorie. Pour ce faire, vous devez savoir avec quelles probabilités le cas "a commencé" - c'est-à-dire avant de supposer l'augmentation de 1 sur le prédicteur en question. Les ratios de probabilités varieront au cas par cas, tandis que le rapport de cotes lié à une augmentation de 1 sur le prédicteur reste le même.


"Si exp (B) = 6, alors le rapport de cotes associé à une augmentation de 1 sur le prédicteur en question est 6", si j'ai lu correctement la réponse de @ whuber, il est dit que le rapport de cotes sera multiplié par 6 avec une augmentation de 1 sur le prédicteur. Autrement dit, le nouveau rapport de cotes ne sera pas de 6. Ou suis-je mal interprété?
rbm

Où vous dites que "le nouveau rapport de cotes ne sera pas de 6", je dirais "que le nouveau rapport de cotes ne sera pas de 6 ... mais que le rapport de la nouvelle à l'ancienne cote sera de 6."
rolando2

Oui, je suis d'accord avec ça! Mais je pensais juste que "l'odds ratio associé à une augmentation de 1 sur le prédicteur en question est de 6" ne le dit pas vraiment. Mais peut-être que je l'interprète mal alors. Merci pour la clarification!
rbm

1

Je cherchais également la même réponse, mais la réponse ci-dessus n'était pas satisfaisante pour moi. Cela semblait complexe pour ce que c'est vraiment. Je vais donc donner mon interprétation, veuillez me corriger si je me trompe.

Lisez cependant jusqu'au bout, car c'est important.

Tout d'abord, les valeurs B et Exp (B) sont celles que vous recherchez. Si le B est négatif, votre Exp (B) sera inférieur à un, ce qui signifie que les chances diminuent. S'il est supérieur, l'Exp (B) sera supérieur à 1, ce qui signifie que les chances augmentent. Puisque vous multipliez par le facteur Exp (B).

Malheureusement, vous n'y êtes pas encore. Parce que dans une régression multinominale, votre variable dépendante a plusieurs catégories, appelons ces catégories D1, D2 et D3. Dont votre dernier est la catégorie de référence. Et supposons que votre première variable indépendante soit le sexe (hommes vs femmes).

Disons que la sortie pour D1 -> hommes est exp (B) = 1,21, cela signifie que pour les hommes, les chances augmentent d'un facteur 1,21 pour être dans la catégorie D1 plutôt que D3 (catégorie de référence) par rapport aux femmes (catégorie de référence).

Vous comparez donc toujours avec votre catégorie de référence des variables dépendantes mais aussi indépendantes. Ce n'est pas vrai si vous avez une variable covariable. Dans ce cas, cela signifierait; une augmentation d'une unité de X augmente les chances d'un facteur de 1,21 d'être dans la catégorie D1 plutôt que D3.

Pour ceux avec une variable dépendante ordinale:

Si vous avez une variable dépendante ordinale et n'avez pas effectué de régression ordinale en raison de l'hypothèse de cotes proportionnelles par exemple. Gardez à l'esprit que votre catégorie la plus élevée est la catégorie de référence. Vos résultats comme ci-dessus sont valables pour rapporter. Mais gardez à l'esprit qu'une augmentation des cotes signifie en fait une augmentation des chances d'être dans la catégorie inférieure plutôt que la plus élevée! Mais ce n'est que si vous avez une variable dépendante ordinale.

Si vous voulez connaître l'augmentation en pourcentage, alors prenez une cote fictive, disons 100 et multipliez-la par 1,21 qui est 121? Par rapport à 100, combien a-t-il changé en pourcentage?


0

Supposons que exp (b) dans un mlogit soit 1,04. si vous multipliez un nombre par 1,04, il augmente de 4%. C'est le risque relatif d'être dans la catégorie a au lieu de b. Je soupçonne qu'une partie de la confusion ici pourrait avoir à voir avec 4% (sens multiplicatif) et 4 points de pourcentage (sens additif). L'interprétation du% est correcte si nous parlons d'une variation en pourcentage et non d'une variation en points de pourcentage. (Ce dernier n'aurait aucun sens de toute façon car les risques relatifs ne sont pas exprimés en termes de pourcentages.)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.