Il nous faudra un certain temps pour y arriver, mais en résumé, un changement d'une unité dans la variable correspondant à B multipliera le risque relatif du résultat (par rapport au résultat de base) par 6,012.
On pourrait exprimer cela comme une augmentation de "5012%" du risque relatif , mais c'est une façon confuse et potentiellement trompeuse de le faire, car cela suggère que nous devrions penser aux changements de manière additive, alors qu'en fait le modèle logistique multinomial nous encourage fortement à pensez de manière multiplicative. Le modificateur «relatif» est essentiel, car un changement dans une variable modifie simultanément les probabilités prédites de tous les résultats, pas seulement celui en question, nous devons donc comparer les probabilités (au moyen de ratios, pas de différences).
Le reste de cette réponse développe la terminologie et l'intuition nécessaires pour interpréter correctement ces déclarations.
Contexte
Commençons par une régression logistique ordinaire avant de passer au cas multinomial.
Pour la variable dépendante (binaire) et les variables indépendantes , le modèle estX iOuiXje
Pr [ Y= 1 ] = exp( β1X1+ ⋯ + βmXm)1 + exp( β1X1+ ⋯ + βmXm);
de manière équivalente, en supposant ,0 ≠ Pr [ Y= 1 ] ≠ 1
Journal( ρ ( X1, ⋯ , Xm))=logPr[Y=1]Pr[Y=0]=β1X1+⋯+βmXm.
(Cela définit simplement , qui est la cote en fonction du .)X iρXi
Sans aucune perte de généralité, le pour que soit la variable et soit le "B" dans la question (pour que ). Fixer les valeurs de et faire varier d'une petite quantité donneX m β m exp ( β m ) = 6,012 X i , 1 ≤ i < m X m δXiXmβmexp(βm)=6.012Xi,1≤i<mXmδ
log(ρ(⋯,Xm+δ))−log(ρ(⋯,Xm))=βmδ.
Ainsi, est le changement marginal des cotes de log par rapport à .X mβm Xm
Pour récupérer , il faut évidemment définir et exposer le côté gauche:δ = 1exp(βm)δ=1
exp( βm)= exp( βm× 1 )= exp( journal( ρ ( ⋯ , Xm+ 1 ) ) - journal( ρ ( ⋯ , Xm) ) )= ρ ( ⋯ , Xm+ 1 )ρ ( ⋯ , Xm).
Cela présente comme le rapport de cotes pour une augmentation d'une unité de . Pour développer une intuition de ce que cela pourrait signifier, tabulez quelques valeurs pour une plage de cotes de départ, en arrondissant fortement pour faire ressortir les modèles:X mexp( βm)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
Pour des cotes vraiment petites , qui correspondent à des probabilités très petites , l'effet d'une augmentation d'une unité dans est de multiplier les cotes ou la probabilité par environ 6,012. Le facteur multiplicatif diminue à mesure que les chances (et la probabilité) augmentent, et a essentiellement disparu une fois que les chances dépassent 10 (la probabilité dépasse 0,9).Xm
En tant que changement additif , il n'y a pas beaucoup de différence entre une probabilité de 0,0001 et 0,0006 (c'est seulement 0,05%), pas plus qu'il n'y a beaucoup de différence entre 0,99 et 1. (seulement 1%). L'effet additif le plus important se produit lorsque les cotes sont égales à , où la probabilité passe de 29% à 71%: une variation de + 42%.1 / 6.012----√∼ 0,408
Nous voyons donc que si nous exprimons le "risque" comme un rapport de cotes, = "B" a une interprétation simple - le rapport de cotes est égal à pour une augmentation d'unité de mais lorsque nous exprimons le risque dans certains d'une autre manière, comme un changement de probabilités, l'interprétation nécessite de préciser la probabilité de départ.β m X mβmβmXm
Régression logistique multinomiale
(Ceci a été ajouté en tant que modification ultérieure.)
Ayant reconnu la valeur de l'utilisation des cotes de log pour exprimer les chances, passons au cas multinomial. Maintenant, la variable dépendante peut être égale à l'une des catégories, indexées par . La probabilité relative qu'il se trouve dans la catégorie estk ≥ 2 i = 1 , 2 , … , k iOuik ≥ 2i = 1 , 2 , … , kje
Pr[Yi]∼exp(β(i)1X1+⋯+β(i)mXm)
avec les paramètres à déterminer et en écrivant pour . Comme abréviation, écrivons l'expression de droite comme ou, où et sont claires par rapport au contexte, simplement . Normaliser pour que toutes ces probabilités relatives soient égales à l'unité donne Y i Pr [ Y = catégorie i ] p i ( X , β ) X β p iβ(i)jYiPr[Y=category i]pi(X,β)Xβpi
Pr[Yi]=pi(X,β)p1(X,β)+⋯+pm(X,β).
(Il y a une ambiguïté dans les paramètres: ils sont trop nombreux. Classiquement, on choisit une catégorie "de base" pour comparaison et force tous ses coefficients à zéro. Cependant, bien que cela soit nécessaire pour rendre compte d'estimations uniques des bêtas, il n'est pas nécessaire d'interpréter les coefficients. Pour maintenir la symétrie - c'est-à-dire pour éviter toute distinction artificielle entre les catégories - n'appliquons pas une telle contrainte à moins que nous ne le soyons obligés.)
Une façon d'interpréter ce modèle consiste à demander le taux de variation marginal des cotes logarithmiques pour n'importe quelle catégorie (disons la catégorie ) par rapport à l'une quelconque des variables indépendantes (disons ). C'est-à-dire que lorsque nous modifions un peu, cela induit un changement dans les cotes logarithmiques de . Nous nous intéressons à la constante de proportionnalité reliant ces deux changements. La règle de chaîne du calcul, avec une petite algèbre, nous dit que ce taux de changement estX j X j Y iiXjXjYi
∂ log odds(Yi)∂ Xj=β(i)j−β(1)jp1+⋯+β(i−1)jpi−1+β(i+1)jpi+1+⋯+β(k)jpkp1+⋯+pi−1+ pi + 1+ ⋯ + pk.
Cela a une interprétation relativement simple comme le coefficient de dans la formule pour la chance que soit dans la catégorie moins un "ajustement". L'ajustement est la moyenne pondérée en fonction de la probabilité des coefficients de dans toutes les autres catégories . Les coefficients de pondération sont calculés en utilisant les probabilités associées aux valeurs courantes des variables indépendantes . Ainsi, la variation marginale des logs n'est pas nécessairement constante: elle dépend des probabilités de toutes les autres catégories, et pas seulement de la probabilité de la catégorie en question (catégorie ).β( i )j Y i X j X iXjOuijeXjXje
Lorsqu'il n'y a que catégories, cela devrait se réduire à une régression logistique ordinaire. En effet, la pondération de probabilité ne fait rien et (choisir ) donne simplement la différence . Laisser la catégorie être le cas de base le réduit encore à , car nous . Ainsi, la nouvelle interprétation généralise l'ancienne.i = 2 β ( 2 ) j - β ( 1 ) j i β ( 2 ) j β ( 1 ) j = 0k = 2i = 2β( 2 )j- β( 1 )jjeβ( 2 )jβ( 1 )j= 0
Pour interpréter , nous allons donc l'isoler d'un côté de la formule précédente, conduisant à:β( i )j
Le coefficient de pour la catégorie est égal au changement marginal des cotes logarithmiques de la catégorie par rapport à la variable , plus la moyenne pondérée en fonction des probabilités des coefficients de tous les autres pour la catégorie .XjjejeXjXj′je
Une autre interprétation, quoique un peu moins directe, est fournie en définissant (temporairement) la catégorie comme cas de base, ce qui rend pour toutes les variables indépendantes :jeβ( i )j= 0Xj
Le taux de variation marginal des cotes logarithmiques du cas de base pour la variable est le négatif de la moyenne pondérée en fonction de la probabilité de ses coefficients pour tous les autres cas.Xj
En fait, l'utilisation de ces interprétations nécessite généralement d'extraire les bêtas et les probabilités de la sortie du logiciel et d'effectuer les calculs comme indiqué.
Enfin, pour les coefficients exponentiels, notons que le rapport de probabilités entre deux résultats (parfois appelé le "risque relatif" de par rapport à ) estjeje′
OuijeOuije′= pje( X, β)pje′( X, β).
Augmentons d'une unité à . Cela multiplie par et par , d'où le risque relatif est multiplié par = . Prendre la catégorie comme cas de base réduit cela à , ce qui nous amène à dire,X j + 1 p i exp ( β ( i ) j ) p i ' exp ( β ( i ′ ) j ) exp (XjXj+ 1pjeexp( β( i )j)pje′exp( β( je′)j)exp )exp( β( i )j) / exp( β( je′)j)exp( β( i )j- β( je′)j)je′exp( β( i )j)
Le coefficient exponentiellement est le montant par lequel le risque relatif est multiplié lorsque la variable est augmentée d'une unité.exp( β( i )j)Pr [ Y= catégorie i ] / Pr [ Y= catégorie de base ]Xj