Communication des résultats d'une régression logistique


13

J'ai la sortie de régression logistique suivante:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

Est-il approprié de signaler cela de la manière suivante:

Coefficient bêta, rapport de cotes, valeur Z, valeur P. Si oui, comment puis-je obtenir le rapport de cotes?


Réponses:


9

Vos rapports suggérés pour une table semblent raisonnables, bien que les valeurs z et les valeurs p soient redondantes. De nombreuses revues que je connais ne signalent pas du tout la valeur z / valeur p et n'utilisent que des astérisques pour signaler la signification statistique. J'ai également vu des tableaux logistiques uniquement avec les rapports de cotes rapportés, bien que je préfère personnellement les cotes logarithmiques et les rapports de cotes signalés si l'espace le permet dans une table.

Mais différents lieux peuvent avoir des guides différents quant aux procédures de rapport, donc ce qui est attendu peut varier. Si je soumets un article à un journal, je vais souvent voir comment d'autres articles récents ont fait leurs tableaux et les imiter. S'il s'agit de votre propre document personnel, demander à quiconque l'examine serait une demande raisonnable. Comme je l'ai mentionné ci-dessus, les contraintes d'espace dans certains sites peuvent vous empêcher de signaler des informations finalement redondantes (telles que les cotes de journal et les rapports de cotes). Certains endroits peuvent vous obliger à rapporter les résultats entièrement en texte!

R2R2

eβ^eβ^exp(coefficient)

De plus, bien que ce soit la réponse actuellement acceptée, lejohn et Frank Harrell donnent tous deux des conseils très utiles. Bien que j'aimerais généralement que les statistiques de la question soient signalées quelque part, les autres réponses aux conseils sur d'autres mesures sont des moyens utiles d'évaluer la taille des effets par rapport aux autres effets estimés dans le modèle. Les procédures graphiques sont également utiles pour examiner les tailles d'effet relatives et voir ces deux articles sur la transformation de tableaux en graphiques à titre d'exemples ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )


Le lien Kastellec & Leoni, 2007 est rompu, mais voici un exemple du même article avec le code.
ACNB du

11

La réponse à cette question peut dépendre de vos antécédents disciplinaires.

Voici quelques considérations générales.

Les bêta en régression logistique sont assez difficiles à interpréter directement. Ainsi, les signaler explicitement n'a qu'une utilité très limitée. Vous devez vous en tenir aux rapports de cotes ou même aux effets marginaux. L'effet marginal de la variable x est la dérivée de la probabilité que vos variables dépendantes soient égales à 1, par rapport à x. Cette façon de présenter les résultats est très appréciée des économistes. Personnellement, je crois que les effets marginaux sont plus facilement compris par les profanes (mais pas seulement par eux ...) que les rapports de cotes.

Une autre possibilité intéressante est d'utiliser des affichages graphiques. Un endroit où vous trouverez quelques illustrations de cette approche est le livre de Gelman et Hill . Je trouve cela encore mieux que de rapporter des effets marginaux.

En ce qui concerne la question sur la façon d'obtenir des rapports de cotes, voici comment vous pouvez le faire dans R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

Avez-vous des exemples de transformation des estimations de l'effet marginal en tableaux (ou références de pages spécifiques dans Gelman et Hill?)
Andy W

1
Gelman et Hill n'utilisent pas vraiment les effets marginaux, mais plutôt des graphiques basés sur des probabilités prédites. Jetez un œil au chapitre cinq, à partir de la page 79.

10

Ce n'est que dans des cas particuliers où les coefficients et leurs anti-logs (odds ratios) sont de bons résumés. C'est lorsque les relations sont linéaires et qu'il y a un coefficient associé à un prédicteur, et lorsqu'un changement d'une unité est une bonne base pour calculer le rapport de cotes (plus OK pour l'âge, pas tant pour le nombre de globules blancs ayant une plage de 500-100 000). En général, des choses comme les rapports de cotes de la plage inter quartile sont utiles. J'ai plus de détails à ce sujet sur http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf et le rmspackage R fait tout cela automatiquement (gestion des termes et interactions non linéaires, calcul des quartiles de X, etc.).


5

Cela dépend probablement de votre public et de votre discipline. La réponse ci-dessous est ce qui est normalement fait pour les revues d'épidémiologie et, dans une moindre mesure, les revues médicales.

Pour être franc, nous ne nous soucions pas des valeurs de p. Sérieusement, nous ne le faisons pas. L'épidémiologie ne vous permettra même pas de les signaler, sauf si vous en avez un besoin vraiment urgent, et le domaine a essentiellement emboîté le pas.

Nous ne nous soucions peut-être même pas des estimations bêta, selon la question. Si votre rapport porte sur quelque chose de plus méthodologique ou axé sur la simulation, je signalerais probablement l'estimation bêta et l'erreur standard. Si vous essayez de signaler un effet estimé dans la population, je m'en tiendrai au rapport de cotes et à l'intervalle de confiance à 95%. C'est la viande de votre estimation, et ce que les lecteurs dans ce domaine rechercheront.

Les réponses ont été publiées ci-dessus pour savoir comment obtenir le rapport de cotes, mais pour l'OR et l'IC à 95%:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

Merci d'avoir répondu! puis-je demander ce que représente le 1,96 dans le calcul?
dessus du

1
Pas de problème :) L'intervalle de confiance à 95% est l'intervalle qui devrait couvrir approximativement du 2,5e centile au 97,5e centile de la distribution normale de votre estimation bêta. Chacun de ces points représente environ 1,96 écart-type de la moyenne (dans ce cas, bêta).
Fomite

oui mais dois-je le faire pour chaque coefficient bêta? le 1.96 change-t-il également? aussi ce sont des données binomiales est-il toujours basé sur la distribution normale?
dessus du

2
Oui - pour chaque coefficient bêta, vous pouvez obtenir un rapport de cotes et une limite de confiance de 95%. Le 1,96 ne changera pas sauf si vous souhaitez calculer un percentile différent pour l'intervalle de confiance (90%, 99%, etc.), mais comme 95% est standard, il n'est pas nécessaire de le faire. Et tant que vous travaillez sur l'échelle logarithmique, les paramètres d'un modèle de régression logistique sont normalement distribués. Une fois que vous les avez exponentiés, cela cesse d'être vrai.
Fomite
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.