Si vous avez une seule variable explicative, disons groupe de traitement, un modèle de régression de Cox est équipé coxph()
; le coefficient ( coef
) se lit comme un coefficient de régression (dans le contexte du modèle de Cox, décrit ci-après) et son exponentielle vous donne le danger dans le groupe de traitement (par rapport au groupe témoin ou placebo). Par exemple, si , alors le danger est , soit 16,5%.β^= - 1,80exp( - 1,80 ) = 0,165
Comme vous le savez peut-être, la fonction de danger est modélisée comme
h ( t ) = h0( t ) exp( β′x )
où est le risque de base. Les aléas dépendent multiplicativement des covariables, et est le rapport des aléas entre deux individus dont les valeurs de diffèrent d'une unité lorsque toutes les autres covariables sont maintenues constantes. Le rapport des dangers de deux individus et est , et est appelé le hazard ratio (ou taux d'incidence). Ce rapport est supposé constant dans le temps, d'où le nom de danger proportionnel .h0(t)exp(β1)x1ijexp(β′(xi−xj))
Pour faire écho à votre question précédente survreg
, ici la forme de n'est pas spécifiée; plus précisément, il s'agit d'un modèle semi-paramétrique en ce que seuls les effets des covariables sont paramétrés, et non la fonction de hasard. En d'autres termes, nous ne faisons aucune hypothèse de distribution sur les temps de survie.h0(t)
Les paramètres de régression sont estimés en maximisant la log-vraisemblance partielle définie par
ℓ=∑flog(exp(β′xf)∑r(f)exp(β′xr))
où la première sommation concerne tous les décès ou échecs , et la deuxième sommation concerne tous les sujets encore en vie (mais à risque) au moment de l'échec - c'est ce qu'on appelle l' ensemble de risques . En d'autres termes, peut être interprété comme la vraisemblance du profil de log pour après avoir éliminé (ou en d'autres termes, la LL où les ont été remplacés par des fonctions de qui maximisent la vraisemblance avec par rapport à pour un vecteur fixe ).r ( f ) ℓ β h 0 ( t ) h 0 ( t ) β h 0 ( t ) βfr(f)ℓβh0(t)h0(t)βh0(t)β
À propos de la censure, il n'est pas clair si vous faites référence à la censure de gauche (comme cela pourrait être le cas si nous considérons une origine pour l'échelle de temps antérieure au moment où l'observation a commencé, également appelée entrée différée ), ou à la censure de droite. Dans tous les cas, plus de détails sur le calcul des coefficients de régression et la façon dont le package de survie gère la censure peuvent être trouvés dans Therneau et Grambsch, Modelling Survival Data (Springer, 2000). Terry Therneau est l'auteur de l'ancien package S. Un tutoriel en ligne est disponible.
L'analyse de survie dans R , par David Diez, fournit une bonne introduction à l'analyse de survie dans R. Un bref aperçu des tests pour les paramètres de régression est donné p. 10. J'espère que cela devrait aider à clarifier l'aide en ligne citée par @onestop , "coefficients les coefficients du prédicteur linéaire, qui multiplient les colonnes de la matrice du modèle". Pour un manuel appliqué, je recommande l' analyse des données médicales à l'aide de S-PLUS , par Everitt et Rabe-Hesketh (Springer, 2001, chap.16 et 17), dont la plupart des éléments ci-dessus proviennent. Une autre référence utile est l'annexe de John Fox sur la régression des risques proportionnels de Cox pour les données de survie .χ2