J'ai 3 essais chacun sur 87 animaux dans chacun des 2 contextes (certaines données manquantes; aucune donnée manquante = 64 animaux). Dans un contexte, j'ai de nombreuses mesures spécifiques ( le temps d'entrer, le nombre de fois de retour à l' abri, etc.), donc je veux développer 2 à 3 scores de comportement composites qui décrivent le comportement dans ce contexte (les appeler C1
, C2
, C3
). Je veux un C1
qui signifie la même chose sur les 3 essais et 87 animaux, afin que je puisse faire une régression pour examiner l'effet de l'âge, du sexe, du pedigree et de chaque animal sur le comportement. Ensuite, je veux examiner la C1
relation avec les scores de comportement dans l'autre contexte, au sein de l'âge particulier. (À l'âge 1, l'activité dans le contexte 1 prédit-elle fortement l'activité dans le contexte 2?)
Si ce n'était pas des mesures répétées, une PCA fonctionnerait bien - faites une PCA sur les multiples mesures d'un contexte, puis utilisez PC1, PC2, etc. pour examiner les relations (corrélations de Spearman) entre PC1 dans un contexte et PC1 (ou 2 ou 3) dans l'autre contexte. Le problème, ce sont les mesures répétées qui tombent dans la pseudoréplication. Un critique a catégoriquement dit non, mais je ne trouve aucune référence claire quant à savoir si cela pose problème lors de la réduction des données.
Mon raisonnement est le suivant: les mesures répétées ne sont pas un problème, car ce que je fais dans l'APC est purement descriptif par rapport aux mesures initiales. Si je déclarais par fiat que j'utilisais le temps pour entrer dans l'arène comme mesure "d'audace" dans le contexte 1, j'aurais une mesure d'audace dans le contexte 1 qui serait comparable pour tous les individus à tous les âges et personne ne bat l'œil. Si je déclare par fiat que j'utiliserai time-to-enter time-to-far-end, il en va de même. Donc, si j'utilise PCA uniquement à des fins réductrices, pourquoi ne peut-il pas s'agir de PC1 (cela pourrait être entrer terminer temps total ...), qui est au moins informé par mes multiples mesures au lieu de deviner que le temps d'entrer est un trait généralement informatif et représentatif?
(Notez que je ne suis pas intéressé par la structure sous-jacente des mesures ... mes questions portent sur ce que nous interprétons comme les comportements spécifiques au contexte. "Si j'ai utilisé le contexte 1 et conclu que Harry est actif par rapport à d'autres animaux, est-ce que je vois Harry actif dans le contexte 2? S'il change ce que nous interprétons comme activité dans le contexte 1 en vieillissant, change-t-il également son activité dans le contexte 2?)
J'ai examiné PARAFAC et j'ai examiné SEM, et je ne suis pas convaincu que l'une ou l'autre de ces approches soit meilleure ou plus appropriée à la taille de mon échantillon. Quelqu'un peut-il peser? Merci.