Analyse chronologique


10

Je mène des recherches sur la relation entre le rang de naissance d'une personne et le risque ultérieur d'obésité en utilisant les données de plusieurs cohortes de naissance d'un an (par exemple http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Un défi majeur est que l'ordre de naissance est lié à d'autres caractéristiques telles que l'âge maternel, le nombre de frères et sœurs plus jeunes et / ou plus âgés et l'espacement des naissances, qui peuvent également influencer le résultat via différents mécanismes. De plus, toute influence de ces éléments sur le risque d'obésité ultérieur pourrait être modifiée par la composition par sexe des frères et sœurs, y compris l '«enfant index» (le participant de la cohorte de naissance).

Pour chaque enfant index, on pouvait tracer une chronologie qui montrait toutes les naissances dans la famille, l'âge maternel étant variable dans le temps.

entrez la description de l'image ici

J'essaie d'identifier des méthodes pour analyser ces types de données, où l'ordre, le calendrier et la nature des événements pourraient tous être importants. Je pose cette question ici en raison de la diversité des applications avec lesquelles les membres travaillent - je m'attends à ce que quelqu'un ait des suggestions immédiates qui me prendront beaucoup plus de temps à m'identifier seul. Tout coup de pouce dans la bonne direction serait grandement apprécié.

Question (s) connexe (s): Comment dois-je analyser les données sur les intervalles de naissance des femmes?


1
+1. La question habituelle: avez-vous les données de l'IMC des parents?
Deer Hunter

Oui, il existe des données anthropométriques longitudinales pour les mères des enfants index. Pas sur les frères et sœurs malheureusement, ce qui exclut toute analyse intra vs entre familles.
DL Dahly

Pas beaucoup de réflexions utiles sur la question du calendrier pour le moment. Vous pouvez vouloir avoir l'âge maternel au premier accouchement comme une autre variable indépendante; Je suppose que vous avez déjà fait une analyse exploratoire et une visualisation ...
Deer Hunter

Il est clairement important de tenir compte de l'âge maternel, c'est pourquoi les délais ci-dessus utilisent l'âge maternel comme variable temporelle. Je suppose que ce que j'espère trouver, c'est une méthode alternative qui offre plus que de simplement tout jeter dans un modèle linéaire.
DL Dahly

Je ne sais pas si cela importe, mais je pense que le poids à la naissance ou le poids moyen à la naissance des enfants d'une femme pourrait être une covariable intéressante. Pouvez-vous également fournir plus d'informations sur votre résultat? Avez-vous des mesures répétées?
ReliableResearch

Réponses:


2

Vous pourriez envisager d'utiliser des modèles à plusieurs niveaux (régression mixte) pour estimer les effets inter et intra familiaux. Une stratégie possible consiste à utiliser une approche planifiée de construction de modèles hiérarchiques. Par exemple, testez chaque prédicteur potentiel dans un modèle univarié. Si les effets entre familles suppriment l'effet d'ordre de naissance, cela suggère fortement que l'ordre de naissance n'est pas important mais que d'autres influences le sont. Un exemple de citation pour cela pour les effets de l'ordre de naissance sur le QI:

J'espère que cela vous sera utile.


+1 pour une bonne idée que j'ai également rencontrée, mais je n'ai pas de données de résultats sur les frères et sœurs pour cette analyse particulière.
DL Dahly

0

J'aborde cette question comme une question statistique et je n'ai aucune connaissance particulière des problèmes médicaux.

En regardant l'article auquel vous faites référence, je constate qu'une cohorte comptait 970 individus. Si vous disposez de données sur plusieurs cohortes d'environ cette taille, la taille globale de votre ensemble de données offre la possibilité de sélectionner des sous-ensembles raisonnablement grands dans lesquels la chronologie de chaque individu remplit des conditions spécifiques. Par exemple, un sous-ensemble pourrait comprendre, disons, tous les individus de sexe masculin âgés de 25 à 29 ans. Une régression, pour un tel sous-ensemble, d'une mesure appropriée de l'obésité ultérieure par rapport au rang de naissance éliminerait tout effet possible sur l'obésité ultérieure des différences de sexe de l'enfant indice et éliminerait en grande partie tout effet possible de l'âge maternel.

Il n'est pas simple d'étendre cette approche au sexe des frères et sœurs, car si une condition pour un sous-ensemble était, par exemple, que l'enfant index ait une sœur plus âgée, cela implique que l'enfant index n'est pas lui-même un enfant aîné, ce qui rétrécit la fourchette de la variable indépendante dans la régression. Cependant, un moyen de contourner ce problème pourrait être de définir les conditions en utilisant «le cas échéant». Par exemple, un sous-ensemble pourrait être défini pour inclure tous les hommes de 25 à 29 ans et les frères et sœurs plus âgés, le cas échéant, toutes les femmes. Un tel sous-ensemble inclurait toujours des individus avec n'importe quel ordre de naissance.

Si un sous-ensemble était défini par un ensemble de conditions trop complexes, le nombre d'individus qu'il contiendrait pourrait être si petit que les estimations des coefficients qui en résulteraient seraient trop imprécises pour être utiles. Si cette approche était adoptée, il faudrait probablement trouver un compromis de jugement, dans la définition des sous-ensembles, entre l'élimination du plus grand nombre possible d'effets et l'inclusion d'un nombre suffisant d'individus pour produire un résultat utile.


Merci pour la réponse Adam. Dans ce cas cependant, je ne pense pas que la stratification de l'échantillon vous dira quoi que ce soit au-delà d'un modèle ajusté de manière similaire. Il se peut très bien qu'un modèle linéaire correctement spécifié soit la meilleure façon de le faire ... J'espérais simplement voir si les statisticiens dans d'autres domaines traitaient des problèmes similaires de différentes manières.
DL Dahly

Je suis d'accord - si c'est ce que vous dites - que mon approche équivaut à une régression unique sur l'ensemble des données en utilisant de nombreuses variables d'indicateur. En prenant l'âge maternel comme exemple, un problème potentiel avec tout modèle qui le traite comme une variable continue est qu'il nécessite une hypothèse sur la forme fonctionnelle (une relation entre l'âge maternel et l'obésité ultérieure peut être curviligne). En revanche, un modèle utilisant un ensemble de variables indicatrices pour les tranches d'âge maternelles n'a pas besoin d'une telle hypothèse et à cet égard est plus général.
Adam Bailey

0

Je suggérerais une analyse des données fonctionnelles, mais je pense que vous pourriez avoir beaucoup de familles avec trop peu d'enfants pour obtenir des estimations raisonnables. Allez-y et lisez-le, car il répond à vos besoins. Peut-être que quelqu'un l'a déjà utilisé avec des données similaires.

Si vous ne voulez pas faire quelque chose d'aussi massivement non paramétrique que cela, vous devez utiliser votre expertise clinique pour réduire la dimensionnalité des données. Par exemple, une variable dans votre modèle pourrait être le nombre d'enfants, une autre pourrait être le nombre moyen d'années entre les enfants, etc. S'il y a un effet dans ces variables, il peut apparaître même si vous n'avez pas correctement spécifié la forme fonctionnelle immédiatement. La construction de modèles davantage basée sur les connaissances peut vous permettre de construire un modèle hautement prédictif - assurez-vous simplement de conserver un ensemble de validation!


J'utilise la FDA et je ne sais pas comment cela s'applique. Je pourrais définir l'axe x = 0 pour chaque enfant d'index, et avoir d'autres frères et sœurs tracés à +/- temps sur cet axe; et ont l'âge maternel comme axe y; puis estimer un objet de données fonctionnelles monotone pour chaque enfant d'index ... mais dès que j'ai fait cela, j'ai perdu toutes les informations sur le nombre réel de frères et sœurs et où ils se situent le long de la ligne (car tout est maintenant résumé par la fonction). La FDA comprend un certain nombre de modes d'analyse - aviez-vous quelque chose de plus spécifique à l'esprit?
DL Dahly
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.