Vous êtes sur la bonne voie, mais regardez toujours la documentation du logiciel que vous utilisez pour voir quel modèle est réellement adapté. Supposons une situation avec une variable dépendante catégorique avec les catégories ordonnées et les prédicteurs .1 , … , g , … , k X 1 , … , X j , … , X pY1,…,g,…,kX1,…,Xj,…,Xp
"Dans la nature", vous pouvez rencontrer trois choix équivalents pour écrire le modèle théorique de cotes proportionnelles avec différentes significations de paramètres implicites:
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g+β1X1+⋯+βpXp(g=1,…,k−1)
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g−(β1X1+⋯+βpXp)(g=1,…,k−1)
- logit(p(Y⩾g))=lnp(Y⩾g)p(Y<g)=β0g+β1X1+⋯+βpXp(g=2,…,k)
(Les modèles 1 et 2 ont la restriction que dans les régressions logistiques binaires distinctes, les ne varient pas avec , et , le modèle 3 a la même restriction sur le , et requiert que )β j g β 0 1 < … < β 0 g < … < β 0 k - 1 β j β 0 2 > … > β 0 g > … > β 0 kk−1βjgβ01<…<β0g<…<β0k−1βjβ02>…>β0g>…>β0k
- Dans le modèle 1, un positif signifie qu'une augmentation de prédicteur est associée à une probabilité accrue d'une faible catégorie en . X jβjXjY
- Le modèle 1 est quelque peu contre-intuitif, donc le modèle 2 ou 3 semble être le logiciel préféré. Ici, un positif signifie qu'une augmentation de prédicteur est associée à une probabilité accrue pour une plus catégorie . X jβjXjY
- Les modèles 1 et 2 conduisent aux mêmes estimations pour le , mais leurs estimations pour le ont des signes opposés. β jβ0gβj
- Les modèles 2 et 3 conduisent aux mêmes estimations pour le , mais leurs estimations pour le ont des signes opposés. β 0 gβjβ0g
En supposant que votre logiciel utilise le modèle 2 ou 3, vous pouvez dire "avec une augmentation d'une unité de , ceteris paribus, les chances prévues d'observer ' ' par rapport à l'observation de ' 'change d'un facteur . ", et de même" avec une augmentation de 1 unité de , ceteris paribus, les chances prévues d'observer' 'par rapport à l'observation de la modification de ' 'd'un facteur . " Notez que dans le cas empirique, nous n'avons que les cotes prévues, pas les réelles.X1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Badeβ^1=0.607
Voici quelques illustrations supplémentaires pour le modèle 1 avec catégories. Premièrement, l'hypothèse d'un modèle linéaire pour les logits cumulatifs à cotes proportionnelles. Deuxièmement, les probabilités implicites d'observer au plus la catégorie . Les probabilités suivent des fonctions logistiques de même forme.
k=4g
Pour les probabilités de catégorie elles-mêmes, le modèle représenté implique les fonctions ordonnées suivantes:
PS À ma connaissance, le modèle 2 est utilisé dans SPSS ainsi que dans les fonctions R MASS::polr()
et ordinal::clm()
. Le modèle 3 est utilisé dans les fonctions R rms::lrm()
et VGAM::vglm()
. Malheureusement, je ne connais pas SAS et Stata.