En général, je standardise mes variables indépendantes en régressions, afin de comparer correctement les coefficients (de cette façon ils ont les mêmes unités: les écarts-types). Cependant, avec des données de panel / longitudinales, je ne sais pas comment je devrais standardiser mes données, surtout si j'évalue un modèle hiérarchique.
Pour voir pourquoi cela peut être un problème potentiel, supposons que vous avez individus mesurés le long de t = 1 , … , périodes T et que vous avez mesuré une variable dépendante, y i , t et une variable indépendante x i , t . Si vous exécutez une régression de regroupement complète, vous pouvez normaliser vos données de cette manière: x . z = ( x - moyenne ( x ) ) / sd ( x , car il ne changera pas la statistique t. D'un autre côté, si vous correspondez à une régression non regroupée, c'est-à-dire une régression pour chaque individu, vous devez standardiser vos données par individu uniquement, pas l'ensemble de données entier (en code R):
for (i in 1:n) {
for ( t in 1:T) x.z[i] = (x[i,t] - mean(x[i,]))/sd(x[i,])
}
Cependant, si vous ajustez un modèle hiérarchique simple avec une interception variable selon les individus, alors vous utilisez un estimateur de rétrécissement, c'est-à-dire que vous estimez un modèle entre une régression groupée et non groupée. Comment dois-je standardiser mes données? Vous utilisez toutes les données comme une régression groupée? Utiliser uniquement des individus, comme dans le cas non partagé?