Je suis un épidémiologiste qui essaie de comprendre les GEE afin d'analyser correctement une étude de cohorte (en utilisant la régression de Poisson avec un lien log, pour estimer le risque relatif). J'ai quelques questions sur la "corrélation de travail" que j'aimerais que quelqu'un de mieux informé clarifie:
(1) Si j'ai répété des mesures chez le même individu, est-il généralement plus raisonnable de supposer une structure échangeable? (Ou un autorégressif si les mesures montrent une tendance)? Qu'en est-il de l'indépendance - y a-t-il des cas où l'on pourrait supposer l'indépendance pour des mesures chez le même individu?
(2) Existe-t-il un moyen (raisonnablement simple) d'évaluer la structure appropriée en examinant les données?
(3) J'ai remarqué que, lors du choix d'une structure d'indépendance, j'obtiens les mêmes estimations ponctuelles (mais des erreurs standard inférieures) que lors de l'exécution d'une régression de Poisson simple (en utilisant R, la fonction glm()
et à geeglm()
partir du package geepack
). Pourquoi cela arrive-t-il? Je comprends qu'avec les GEE, vous estimez un modèle à moyenne de population (contrairement à un sujet spécifique), vous ne devriez donc obtenir les mêmes estimations ponctuelles que dans le cas de la régression linéaire.
(4) Si ma cohorte se trouve sur plusieurs sites (mais une mesure par individu), dois-je choisir une indépendance ou une corrélation de travail échangeable, et pourquoi? Je veux dire, les individus de chaque site sont toujours indépendants les uns des autres, non ?? Ainsi, pour un modèle spécifique à un sujet, par exemple, je spécifierais le site comme un effet aléatoire. Avec GEE cependant, l'indépendance et l'échange donnent des estimations différentes et je ne sais pas laquelle est la meilleure en termes d'hypothèses sous-jacentes.
(5) GEE peut-il gérer un regroupement hiérarchique à 2 niveaux, c'est-à-dire une cohorte multi-sites avec des mesures répétées par individu? Si oui, que dois-je spécifier comme variable de clustering geeglm()
et quelle devrait être la corrélation de travail si l'on suppose par exemple "indépendance" pour le premier niveau (site) et "échangeable" ou "autorégressif" pour le deuxième niveau (individuel)?
Je comprends que ce sont quelques questions, et certaines d'entre elles peuvent être assez basiques, mais toujours très difficiles à comprendre pour moi (et peut-être d'autres novices?). Donc, toute aide est grandement et sincèrement appréciée, et pour montrer cela, j'ai commencé une prime.