Calcul du rapport de risque à l'aide du rapport de cotes à partir du coefficient de régression logistique


8

J'ai une régression logistique binaire avec un seul prédicteur à facteur fixe binaire. La raison pour laquelle je ne le fais pas en tant que chi carré ou test exact de Fisher est que j'ai également un certain nombre de facteurs aléatoires (il y a plusieurs points de données par individu et les individus sont en groupes, bien que je ne me soucie pas des coefficients ou des significations pour ces variables aléatoires). Je le fais avec R glmer.

J'aimerais pouvoir exprimer le coefficient et l'intervalle de confiance associé pour le prédicteur sous la forme d'un rapport de risque plutôt que d'un rapport de cotes. C'est parce que (peut-être pas pour vous mais pour mon public) le rapport de risque est beaucoup plus facile à comprendre. Le rapport de risque ici est l'augmentation relative des chances que le résultat soit 1 plutôt que 0 si le prédicteur est 1 plutôt que 0.

Le rapport de cotes est trivial à obtenir à partir du coefficient et de l'IC associé à l'aide de exp (). Pour convertir un rapport de cotes en un rapport de risque, vous pouvez utiliser "RR = OR / (1 - p + (px OR)), où p est le risque dans le groupe témoin" (source: http: //www.r- bloggers.com/how-to-convert-odds-ratios-to-relative-risks/). Mais, vous avez besoin du risque dans le groupe témoin, ce qui signifie dans mon cas la chance que le résultat soit 1 si le prédicteur est 0. Je crois que le coefficient d'interception du modèle est en fait la cote de cette chance, donc je peux utiliser prob = cotes / (cotes + 1) pour obtenir cela. Je suis à peu près si bon sur ce point en ce qui concerne l'estimation centrale du rapport de risque. Mais ce qui m'inquiète, c'est l'intervalle de confiance associé, car le coefficient d'interception a également son propre IC associé. Dois-je utiliser l'estimation centrale de l'ordonnée à l'origine, ou pour être prudent, dois-je utiliser les limites de l'IC d'interception qui rendent mon IC de risque relatif plus large? Ou suis-je en train d'aboyer complètement le mauvais arbre?



Ce n'est en aucun cas un double de cette question. Je n'ai aucun problème à obtenir des rapports de cotes, ce sont les rapports de risques qui m'interrogent. Ils ne sont pas mentionnés dans cette question.
Amorphia

Réponses:


5

Zhang 1998 a initialement présenté une méthode de calcul des IC pour les ratios de risque suggérant que vous pourriez utiliser les limites inférieures et supérieures de l'IC pour le rapport de cotes.

Cette méthode ne fonctionne pas, elle est biaisée et produit généralement des estimations anticonservatrices (trop strictes) du rapport de risque IC à 95%. Cela est dû à la corrélation entre le terme d'interception et le terme de pente comme vous le faites correctement allusion. Si le rapport de cotes tend vers sa valeur plus faible dans l'IC, le terme d'interception augmente pour tenir compte d'une prévalence globale plus élevée chez ceux avec un niveau d'exposition de 0 et inversement pour une valeur plus élevée dans l'IC. Chacun de ces facteurs conduit respectivement à des limites inférieures et supérieures pour l'IC.

Pour répondre directement à votre question, vous devez connaître la prévalence de référence du résultat pour obtenir des intervalles de confiance corrects. Les données des études cas-témoins s'appuieraient sur d'autres données pour éclairer cela.

Vous pouvez également utiliser la méthode delta si vous disposez de la structure de covariance complète pour les estimations de paramètres. Une paramétrisation équivalente pour la transformation OR en RR (ayant une exposition binaire et un seul prédicteur) est:

RR=1+exp(-β0)1+exp(-β0-β1)

Et en utilisant la méthode delta multivariée et le théorème de la limite centrale qui déclare que , vous pouvez obtenir la variance de la distribution normale approximative du .n([β^0,β^1]-[β0,β1])N(0,je-1(β))RR

Notez que cela ne fonctionne que pour l'exposition binaire et la régression logistique univariée. Il existe quelques astuces R simples qui utilisent la méthode delta et la standardisation marginale pour les covariables continues et d'autres variables d'ajustement. Mais pour être bref, je n'en discuterai pas ici.

Cependant, il existe plusieurs façons de calculer les risques relatifs et son erreur standard directement à partir des modèles de R. Deux exemples de cela ci-dessous:

x <- sample(0:1, 100, replace=T)
y <- rbinom(100, 1, x*.2+.2)
glm(y ~ x, family=binomial(link=log))
library(survival)
coxph(Surv(time=rep(1,100), event=y) ~ x)

http://research.labiomed.org/Biostat/Education/Case%20Studies%202005/Session4/ZhangYu.pdf


AdamO, votre réponse est la plus proche de ce que je recherche. Pouvez-vous, s'il vous plaît, me diriger vers la dérivation du RR à partir du OU d'un modèle multivariable à états multiples?
altfi_SU

@altfi_SU J'ai implémenté ceci dans le paquet epitools en tant que probratio. Notez que le contact est malheureusement obsolète :( rdrr.io/cran/epitools/man/probratio.html
AdamO

Merci, @AdamO. Bon à savoir que ce package existe. Cependant, je travaille avec les résultats publiés d'un modèle multivariable et ne peux donc pas passer un glmobjet comme argument à la probratiofonction. J'ai besoin de trouver le RR dans une méta-analyse. Une piste sous la forme d'une notation mathématique comme vous l'avez écrit ci-dessus?
altfi_SU
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.