Je me sens dépassé après avoir tenté de creuser dans la littérature sur la façon d'exécuter mon analyse de modèle mixte, en suivant l'utilisation d'AIC pour sélectionner le ou les meilleurs modèles. Je ne pense pas que mes données soient si compliquées, mais je recherche la confirmation que ce que j'ai fait est correct, puis je conseille sur la façon de procéder. Je ne sais pas si je dois utiliser lme ou lmer, puis avec l'un ou l'autre, si je dois utiliser REML ou ML.
J'ai une valeur de sélection et je veux savoir quelles covariables influencent le mieux cette valeur et permettent des prédictions. Voici quelques exemples de données composées et mon code pour mon test avec lequel je travaille:
ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)
J'ai ~ 19 modèles qui explorent ces données avec diverses combinaisons et jusqu'à un terme d'interaction à 2 voies, mais toujours avec ID comme effet aléatoire et comp1 comme variable dépendante.
- Q1. Lequel utiliser? lme ou lmer? Est-ce que ça importe?
Dans les deux cas, j'ai la possibilité d'utiliser ML ou REML - et j'obtiens des réponses radicalement différentes - en utilisant ML suivi d'AIC, je me retrouve avec 6 modèles tous avec des valeurs AIC similaires et les combinaisons de modèles n'ont tout simplement aucun sens, alors que REML résulte que 2 des modèles les plus probables sont les meilleurs. Cependant, lors de l'exécution de REML, je ne peux plus utiliser anova.
- Q2. est la principale raison d'utiliser ML sur REML en raison de son utilisation avec ANOVA? Ce n'est pas clair pour moi.
Je ne suis toujours pas en mesure d'exécuter stepAIC ou je ne connais pas d'autre moyen d'affiner ces 19 modèles.
- Q3. existe-t-il un moyen d'utiliser stepAIC à ce stade?