Mon collègue et moi ajustons une gamme de modèles d'effets mixtes linéaires et non linéaires dans R. On nous demande d'effectuer une validation croisée sur les modèles ajustés afin que l'on puisse vérifier que les effets observés sont relativement généralisables. C'est normalement une tâche triviale, mais dans notre cas, nous devons diviser l'ensemble des données en une partie de formation et une partie de test (à des fins de CV) qui ne partagent aucun niveau commun. Par exemple,
Les données d'entraînement peuvent être basées sur les groupes 1, 2, 3, 4; Le modèle ajusté est ensuite validé de façon croisée sur le groupe 5.
Cela crée donc un problème car les effets aléatoires basés sur les groupes estimés sur les données d'entraînement ne s'appliquent pas aux données de test. Ainsi, nous ne pouvons pas CV le modèle.
Existe-t-il une solution relativement simple à cela? Ou quelqu'un a-t-il déjà écrit un paquet pour résoudre ce problème? Tout indice est le bienvenu!
Merci!