Je travaille sur un projet où nous observons le comportement sur une tâche (par exemple le temps de réponse) et modélisons ce comportement en fonction de plusieurs variables expérimentalement manipulées ainsi que de plusieurs variables observées (sexe du participant, QI du participant, réponses sur un suivi- questionnaire). Je ne m'inquiète pas de la multicolinéarité parmi les variables expérimentales car elles ont été spécifiquement manipulées pour être indépendantes, mais je suis préoccupé par les variables observées. Cependant, je ne sais pas comment évaluer l'indépendance parmi les variables observées, en partie parce que je semble obtenir des résultats quelque peu différents selon la façon dont je configure l'assesseur, et aussi parce que je ne suis pas très familier avec la corrélation dans le contexte où une ou les deux variables sont dichotomiques.
Par exemple, voici deux approches différentes pour déterminer si le sexe est indépendant du QI. Je ne suis pas un fan des tests de signification d'hypothèse nulle, donc dans les deux approches, je construis deux modèles, un avec une relation et l'autre sans, puis calcul et rapport de vraisemblance du journal corrigé AIC:
m1 = lm(IQ ~ 1)
m2 = lm(IQ ~ sex)
LLR1 = AIC(m1)-AIC(m2)
m3 = glm(sex~1,family='binomial')
m4 = glm(sex~IQ,family='binomial')
LLR2 = AIC(m3)-AIC(m4)
Cependant, ces approches donnent des réponses quelque peu différentes; LLR1 est d'environ 7, ce qui suggère des preuves solides en faveur d'une relation, tandis que LLR2 est d'environ 0,3, ce qui suggère des preuves très faibles en faveur d'une relation.
De plus, si j'essaie d'évaluer l'indépendance entre le sexe et une autre variable observée dichotomique, "yn", le LLR résultant dépend de la même manière si je configure les modèles pour prédire le sexe à partir de yn, ou pour prédire yn à partir du sexe.
Avez-vous des suggestions sur la raison de ces différences et sur la manière la plus raisonnable de procéder?
seq
dans votre code pour une faute de frappesex
? Si vous avez copié-collé votre code d'analyse, cela pourrait faire partie du problème ..