J'examine les tendances (entre 1998 et 2011) des taux de mortalité chez les patients atteints de la maladie de Crohn. Chaque patient (cas) a été inclus entre 1998 et 2011. À l'inclusion, chaque patient a été apparié à un contrôle sain de même âge et de même sexe. J'analyse les tendances des taux de mortalité. En faisant cela directement, sans aucun ajustement, j'obtiens des taux de mortalité fluctuants dans le temps, ce qui est probablement dû au fait que les individus inclus une année donnée ne seront pas comparables à ceux inclus une autre année. Je vise donc à ajuster les taux de mortalité. Je m'attends à ce que les taux de mortalité dans les deux groupes (cas et témoins) diminuent avec le temps et l'écart entre les cas et les témoins se réduise successivement.
Mon idée est de faire l'ajustement par régression de Poisson. Mes données sont au niveau individuel. Je souhaite obtenir une estimation du taux d'incidence (pour 1 000 années-personnes) des cas et des témoins chaque année de 1998 à 2011. Le temps de survie serait inclus comme décalage dans le modèle. Quelque chose de similaire a été fait ici .
J'ai joint les 200 premières lignes de mon ensemble de données, qui comprend 1500 personnes. Voici les données . Explication variable:
- mort = si le patient est décédé ou non pendant le suivi
- surv = durée de survie en jours
- groupe d'âge = groupe d'âge catégorisé (4 groupes)
- sexe = homme / femme
- diagnostic = 0 pour un contrôle sain, 1 pour la maladie de Crohn
- âge = âge en années
- inclusion_year = année d'inclusion dans l'étude
Qu'est-ce que j'ai essayé jusqu'à présent? J'ai essayé d'adapter les modèles de Poisson avec la fonction glm () dans R, en utilisant des observations individuelles (log (surv) comme décalage), mais j'ai reçu une erreur ou je n'ai pas pu comprendre comment utiliser les ajustements. J'ai également agrégé les données en groupes, puis analysé le nombre de décès dans glm (); lorsque j'ai utilisé l'ajustement pour obtenir des taux d'incidence, je ne pouvais obtenir que des taux pour un âge / groupe d'âge et un sexe spécifiques (comme cela devait être spécifié dans la fonction prédire ()).
J'apprécierais vraiment quelques conseils statistiques et des exemples de codage, qui peuvent être faits sur l'ensemble de données joint.
contrasts<-
( *tmp*
, value = contr.funs [1 + isOF [nn]]): les contrastes ne peuvent être appliqués qu'aux facteurs avec 2 niveaux ou plus
diagnosis*inclusion_year
termes d'interaction. Si vous utilisez simplement le modèle actuel, le nombre de cas ne différera que par la version bêta de diagnosis
, constante au fil des ans car il n'est pas autorisé à interagir. Par la suite, les prédictions ne seront que substitution. Je ne suis pas trop difficile donc je ne ferais que sous-estimer l'âge moyen et le pourcentage moyen d'hommes.