Le contexte
J'essaie de comprendre comment coxph () de R accepte et gère les entrées répétées pour les sujets (ou le patient / client si vous préférez). Certains appellent ce format long, d'autres l'appellent «mesures répétées».
Voir par exemple l'ensemble de données qui inclut la colonne ID dans la section Réponses à:
Meilleurs packages pour les modèles Cox avec des covariables variant dans le temps
Supposons également que les covariables varient dans le temps et qu'il existe exactement une variable de censure (c'est-à-dire un événement), qui est binaire.
Des questions
1) Dans la réponse du lien ci-dessus, si ID n'est pas donné comme paramètre dans l'appel à coxph (), les résultats devraient-ils être les mêmes que l'inclusion de cluster (ID) comme paramètre dans coxph ()?
J'ai tenté de rechercher de la documentation, mais les éléments suivants ne semblent pas aborder clairement (1): https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
2) Si la réponse à (1) est «non», alors (mathématiquement) pourquoi? Il semble que cluster () dans coxph () cherche des corrélations entre les sujets selon la sous-section «cluster» à la p. 20 à
https://cran.r-project.org/web/packages/survival/survival.pdf
3) Question vague: comment le coxph () avec des mesures répétées se compare-t-il aux méthodes de régression de Frailtypack de R?
Addenda
Les conseils suivants sur l'utilisation du cluster (ID):
Existe-t-il une version prenant en compte les mesures répétées du test du logrank?
de même que:
https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
Approche GEE: ajouter "+ cluster (sujet)" à l'énoncé du modèle dans coxph Approche des modèles mixtes: ajouter "+ (1 | sujet)" à l'énoncé du modèle dans coxme.
Merci d'avance!