Ma situation est:
J'ai 1 variable dépendante continue et 1 variable prédictive continue que j'ai transformée logarithmiquement pour normaliser leurs résidus pour une régression linéaire simple.
J'apprécierais toute aide sur la façon dont je peux relier ces variables transformées à leur contexte d'origine.
Je veux utiliser une régression linéaire pour prédire le nombre de jours que les élèves ont manqué l'école en 2011 sur la base du nombre de jours qu'ils ont manqués en 2010. La plupart des élèves manquent 0 jour ou quelques jours seulement, les données sont positivement biaisées vers la gauche. Par conséquent, il existe un besoin de transformation pour utiliser la régression linéaire.
J'ai utilisé log10 (var + 1) pour les deux variables (j'ai utilisé +1 pour les élèves qui avaient manqué 0 jours d'école). J'utilise la régression parce que je veux ajouter des facteurs catégoriels - sexe / origine ethnique, etc.
Mon problème est:
Le public auquel je veux revenir ne comprendrait pas log10 (y) = log (constant) + log (var2) x (et franchement moi non plus).
Mes questions sont:
a) Y a-t-il de meilleures façons d'interpréter les variables transformées dans la régression? C'est-à-dire pour toujours 1 jour manqué en 2010, ils manqueront 2 jours en 2011, par opposition à jamais 1 changement d'unité de journal en 2010, il y aura x changement d'unité de journal en 2011?
b) Plus précisément, étant donné le passage cité de cette source comme suit:
"Il s'agit de l'estimation de régression binomiale négative pour une augmentation d'une unité du score du test normalisé en mathématiques, étant donné que les autres variables sont maintenues constantes dans le modèle. Si un étudiant devait augmenter son score au test de maturité d'un point, la différence dans les journaux de les comptes attendus devraient diminuer de 0,0016 unité, tout en maintenant les autres variables du modèle constantes. "
J'aimerais savoir:
- Ce passage dit-il que pour chaque unité, une augmentation du score de la
UNTRANSFORMED
variable mathématique entraîne une diminution de 0,0016 de la constante (a), donc si leUNTRANSFORMED
score mathématique augmente de deux points, je soustrais 0,0016 * 2 de la constante a? - Cela signifie-t-il que j'obtiens la moyenne géométrique en utilisant exponentielle (a)) et exponentielle (a + bêta * 2) et, que je dois calculer la différence en pourcentage entre ces deux pour dire quel effet la ou les variables prédictives ont / avoir sur la variable dépendante?
- Ou ai-je totalement tort?
J'utilise SPSS v20. Désolé d'avoir cadré cela dans une longue question.
R
contient des forfaits pour les modèles à gonflage nul; recherchez ce site .)