Le temps est accordé; si cela est nécessaire dépendra de ce que vous essayez de modéliser? Le problème que vous avez est que vous avez des covariables qui, ensemble, semblent correspondre à la tendance dans les données, ce que Time peut faire aussi bien mais en utilisant moins de degrés de liberté - elles sont donc abandonnées au lieu de Time.
Si l'intérêt est de modéliser le système, la relation entre la réponse et les covariables dans le temps, plutôt que de modéliser la façon dont la réponse varie dans le temps, alors n'incluez pas le temps comme covariable. Si le but est de modéliser le changement du niveau moyen de la réponse, inclure le temps mais pas la covariable. D'après ce que vous dites, il semblerait que vous souhaitiez le premier, pas le second, et ne devez pas inclure le temps dans votre modèle. (Mais tenez compte des informations supplémentaires ci-dessous.)
Il y a cependant quelques mises en garde. Pour que la théorie se vérifie, les résidus devraient être iid (ou id si vous relâchez l'hypothèse d'indépendance en utilisant une structure de corrélation). Si vous modélisez la réponse en fonction de covariables et qu'elles ne modélisent pas correctement une tendance dans les données, les résidus auront une tendance, ce qui viole les hypothèses de la théorie, à moins que la structure de corrélation ajustée ne puisse faire face à cette tendance.
Inversement, si vous modélisez la tendance dans la seule réponse (en incluant uniquement le temps), il peut y avoir une variation systématique des résidus (autour de la tendance ajustée) qui n'est pas expliquée par la tendance (temps), ce qui peut également violer les hypothèses pour les résidus. Dans de tels cas, vous devrez peut-être inclure d'autres covariables pour rendre les résidus iid
Pourquoi est-ce un problème? Eh bien, lorsque vous testez si la composante de tendance, par exemple, est significative, ou si les effets des covariables sont significatifs, la théorie utilisée supposera que les résidus sont iid. S'ils ne le sont pas, les hypothèses ne seront pas remplies et les Les valeurs de p seront biaisées.
L'intérêt de tout cela est que vous devez modéliser toutes les différentes composantes des données de sorte que les résidus soient iid pour la théorie que vous utilisez, pour tester si les composants ajustés sont significatifs, pour être valides.
À titre d'exemple, considérons les données saisonnières et nous voulons adapter un modèle qui décrit la variation à long terme des données, la tendance. Si nous modélisons uniquement la tendance et non la variation cyclique saisonnière, nous ne pouvons pas tester si la tendance ajustée est significative car les résidus ne seront pas iid. Pour de telles données, nous aurions besoin d'ajuster un modèle avec à la fois une composante saisonnière et une tendance. composant, et un modèle nul qui ne contenait que la composante saisonnière. Nous comparerions ensuite les deux modèles à l'aide d'un test de rapport de vraisemblance généralisé pour évaluer l'importance de la tendance ajustée. Cela se fait en utilisant anova()
sur les $lme
composants des deux modèles équipés en utilisant gamm()
.