Maintenant, je comprends que cela dépend des distributions et de la normalité des prédicteurs
la transformation des journaux rend les données plus uniformes
En règle générale, c'est faux --- mais même si c'était le cas, pourquoi l' uniformité serait-elle importante?
Considérez, par exemple,
i) un prédicteur binaire ne prenant que les valeurs 1 et 2. La prise de journaux le laisserait comme un prédicteur binaire ne prenant que les valeurs 0 et log 2. Cela n'affecte vraiment rien sauf l'interception et la mise à l'échelle des termes impliquant ce prédicteur. Même la valeur de p du prédicteur serait inchangée, tout comme les valeurs ajustées.

ii) envisager un prédicteur de gauche. Prenez maintenant les journaux. Il devient généralement plus asymétrique gauche.

iii) les données uniformes deviennent de gauche

(ce n'est souvent pas toujours un changement aussi extrême, cependant)
moins touché par les valeurs aberrantes
En règle générale, c'est faux. Considérez les valeurs aberrantes faibles dans un prédicteur.

J'ai pensé au log transformant toutes mes variables continues qui ne sont pas d'intérêt principal
À quelle fin? Si à l'origine les relations étaient linéaires, elles ne le seraient plus.

Et s'ils étaient déjà incurvés, le faire automatiquement pourrait les aggraver (plus incurvés), pas mieux.
-
Prendre des journaux d'un prédicteur (qu'il soit d'intérêt principal ou non) peut parfois convenir, mais ce n'est pas toujours le cas.