Les cotes sont un moyen d'exprimer des chances. Les rapports de cotes ne sont que cela: une cote divisée par une autre. Cela signifie qu'un rapport de cotes est ce que vous multipliez par une cote pour en produire une autre. Voyons comment ils fonctionnent dans cette situation courante.
Conversion entre les cotes et les probabilités
Les chances d'une réponse binaire sont le rapport de la chance qu'elle se produit (codé avec 1 ), écrit Pr ( Y = 1 ) , à la chance qu'elle ne le fait pas (codé avec 0 ), écrit Pr ( Y = 0 ) :Y1Pr(Y=1)0Pr(Y=0)
Odds(Y)=Pr(Y=1)Pr(Y=0)=Pr(Y=1)1−Pr(Y=1).
L'expression équivalente à droite montre qu'il suffit de modéliser pour trouver les cotes. Inversement, notons que nous pouvons résoudrePr(Y=1)
Pr(Y=1)=Odds(Y)1+Odds(Y)=1−11+Odds(Y).
Régression logistique
La régression logistique modélise le logarithme des probabilités de en fonction linéaire des variables explicatives. Plus généralement, en écrivant ces variables sous la forme x 1 , … , x p , et en incluant un éventuel terme constant dans la fonction linéaire, nous pouvons nommer les coefficients (qui doivent être estimés à partir des données) comme β 1 , … , β p et β 0 . Formellement, cela produit le modèleYx1,…,xpβ1,…,βpβ0
log(Odds(Y))=β0+β1x1+⋯+βpxp.
Les chances elles-mêmes peuvent être récupérées en annulant le logarithme:
Odds(Y)=exp(β0+β1x1+⋯+βpxp).
Utilisation de variables catégorielles
Les variables catégorielles, telles que le groupe d'âge, le sexe, la présence de glaucome, etc. , sont incorporées au moyen d'un «codage fictif». Pour montrer que la façon dont la variable est codée n'a pas d'importance, je vais fournir un exemple simple d'un petit groupe; sa généralisation à plusieurs groupes devrait être évidente. Dans cette étude, une variable est la «taille de la pupille», avec trois catégories, «Large», «Medium» et «Small». (L'étude les traite comme purement catégoriques, ne prêtant apparemment aucune attention à leur ordre inhérent.) Intuitivement, chaque catégorie a ses propres cotes, par exemple pour "Large", α M pour "Medium" et α S pour "Small" . Cela signifie que, toutes choses égales par ailleurs,αLαMαS
Odds(Y)=exp(αL+β0+β1x1+⋯+βpxp)
pour toute personne de la catégorie "Large",
Odds(Y)=exp(αM+β0+β1x1+⋯+βpxp)
pour toute personne de la catégorie "Medium", et
Odds(Y)=exp(αS+β0+β1x1+⋯+βpxp)
pour ceux de la catégorie "Petit".
Création de coefficients identifiables
J'ai coloré les deux premiers coefficients pour les mettre en évidence, car je veux que vous remarquiez qu'ils permettent un changement simple: nous pourrions choisir n'importe quel nombre et, en l'ajoutant à β 0 et en le soustrayant de chacun de α L , α M et α S , nous ne modifierions aucune cote prédite. C'est à cause des équivalences évidentes de la formeγβ0αLαMαS
αL+β0=(αL−γ)+(γ+β0),
etc. Bien que cela ne pose aucun problème pour le modèle - il prédit toujours exactement les mêmes choses - cela montre que les paramètres ne sont pas en eux-mêmes interprétables. Ce qui reste le même lorsque nous effectuons cette manœuvre d'addition-soustraction, ce sont les différences entre les coefficients. Classiquement, pour remédier à ce manque d'identifiabilité, les personnes (et par défaut, les logiciels) choisissent l'une des catégories de chaque variable comme «base» ou «référence» et stipulent simplement que son coefficient sera nul. Cela supprime l'ambiguïté.
Le document énumère d'abord les catégories de référence; "Large" dans ce cas. Ainsi, est soustraite de chacune des α L , α M , et α S , et ajouté à la ß 0 à compenser.αLαL,αM,αSβ0
La cote logarithmique pour un individu hypothétique entrant dans toutes les catégories de base est donc égale à plus un ensemble de termes associés à toutes les autres «covariables» - les variables non catégorielles:β0
Odds(Base category)=exp(β0+β1X1+⋯+βpXp).
Aucun terme associé à des variables catégorielles n'apparaît ici. (J'ai légèrement changé la notation à ce stade: les bêtas ne sont maintenant que les coefficients des covariables , tandis que le modèle complet inclut les alphas α j pour les différentes catégories.)βiαj
Comparer les cotes
Comparons les cotes. Supposons qu'un individu hypothétique soit un
patient de 80 à 89 ans avec une cataracte blanche, pas de vue de fond, et une petite pupille opérée par un registraire spécialisé, ...
α80-89αmale
α80-89+αmale+αno Glaucoma+⋯+αspecialist registrar.
Il s'agit précisément de la différence entre les cotes logarithmiques de ce patient et la base. Pour convertir à partir des cotes du journal, annulez le logarithme et rappelez-vous que cela transforme l'addition en multiplication. Par conséquent, la cote de base doit être multipliée par
exp(α80-89)exp(αmale)exp(αno Glaucoma)⋯exp(αspecialist registrar).
x1,…,xpexp(α80-89)=1.58exp(αmale)=1.28exp( αpas de glaucome) = 1,00, etc. Selon l'article, leur produit fonctionne pour34,5. Donc
Cotes (Charlie) = 34,5 × Cotes (Base) .
(Notez que les catégories de base ont toutes des rapports de cotes de 1,00 = exp( 0 ), car y compris 1dans le produit le laisse inchangé. C'est ainsi que vous pouvez repérer les catégories de base dans le tableau.)
Retraiter les résultats en probabilités
Enfin, convertissons ce résultat en probabilités. On nous a dit que la probabilité prédite de base est0,736 % = 0,00736. Par conséquent, en utilisant les formules reliant les cotes et les probabilités dérivées au départ, nous pouvons calculer
Cotes (base) = 0,007361 - 0,00736= 0,00741.
Par conséquent, les chances de Charlie sont
Cotes (Charlie) = 34,5 × 0,00741 = 0,256.
Enfin, la conversion de ce retour en probabilités donne
Pr ( Y( Charlie ) = 1 ) = 1 - 11 + 0,256= 0,204.