Pourquoi ne pas transformer en log toutes les variables qui ne sont pas d'intérêt principal?

10

Les livres et les discussions indiquent souvent que face à des problèmes (dont il y en a quelques-uns) avec un prédicteur, la transformation logarithmique est une possibilité. Maintenant, je comprends que cela dépend des distributions et que la normalité des prédicteurs n'est pas une hypothèse de régression; mais la transformation des journaux rend les données plus uniformes, moins affectées par les valeurs aberrantes, etc.

J'ai pensé au log transformant toutes mes variables continues qui ne sont pas d'intérêt principal, c'est-à-dire les variables pour lesquelles je ne règle que.

Est-ce faux? Bien? Inutile?

regression data-transformation

— Adam Robinsson
source

Réponses:

24

Maintenant, je comprends que cela dépend des distributions et de la normalité des prédicteurs

la transformation des journaux rend les données plus uniformes

En règle générale, c'est faux --- mais même si c'était le cas, pourquoi l' uniformité serait-elle importante?

Considérez, par exemple,

i) un prédicteur binaire ne prenant que les valeurs 1 et 2. La prise de journaux le laisserait comme un prédicteur binaire ne prenant que les valeurs 0 et log 2. Cela n'affecte vraiment rien sauf l'interception et la mise à l'échelle des termes impliquant ce prédicteur. Même la valeur de p du prédicteur serait inchangée, tout comme les valeurs ajustées.

entrez la description de l'image ici

ii) envisager un prédicteur de gauche. Prenez maintenant les journaux. Il devient généralement plus asymétrique gauche.

entrez la description de l'image ici

iii) les données uniformes deviennent de gauche

entrez la description de l'image ici

(ce n'est souvent pas toujours un changement aussi extrême, cependant)

moins touché par les valeurs aberrantes

En règle générale, c'est faux. Considérez les valeurs aberrantes faibles dans un prédicteur.

entrez la description de l'image ici

J'ai pensé au log transformant toutes mes variables continues qui ne sont pas d'intérêt principal

À quelle fin? Si à l'origine les relations étaient linéaires, elles ne le seraient plus.

entrez la description de l'image ici

Et s'ils étaient déjà incurvés, le faire automatiquement pourrait les aggraver (plus incurvés), pas mieux.

-

Prendre des journaux d'un prédicteur (qu'il soit d'intérêt principal ou non) peut parfois convenir, mais ce n'est pas toujours le cas.

— Glen_b -Reinstate Monica
source

2

Merci beaucoup pour cette magnifique réponse. Je pense que beaucoup d'entre nous, du moins moi, avaient besoin de voir cela de cette façon. Mais convenez-vous également que les données asymétriques devraient faire l'objet d'une transformation de journal? Plus que d'autres biais et formes?

— Adam Robinsson

1

Pas généralement, non. Dans certaines conditions très spécifiques, peut-être.

— Glen_b -Reinstate Monica

\hat{β} = 0.50

$\hat{\beta}=0.50$

(suite) que de pouvoir dire, par exemple, pour une augmentation d'un pouce du nombre de circonférence du tronc, la hauteur moyenne de l'arbre est augmentée de la moitié du pied. Ce dernier est plus facile à interpréter et à calculer sur le terrain sans calculatrice.

— StatsStudent

10

À mon avis, cela n'a aucun sens d'effectuer une transformation de journal (et toute transformation de données , d'ailleurs) juste pour le plaisir. Comme mentionné précédemment, selon les données, certaines transformations seraient soit invalides , soit inutiles . Je vous recommande fortement de lire l'excellent matériel d'introduction de l' OHMI suivant sur la transformation des données : http://fmwww.bc.edu/repec/bocode/t/transint.html . Veuillez noter que les exemples de code dans ce document sont écrits en langage Stata , mais sinon le document est suffisamment générique et, par conséquent, également utile aux utilisateurs non-Stata.

Quelques techniques et outils simples pour traiter les problèmes courants liés aux données , tels que le manque de normalité , les valeurs aberrantes et les distributions de mélange peuvent être trouvés dans cet article (notez que la stratification en tant qu'approche pour traiter la distribution de mélange est probablement la plus simple - une approche plus générale et complexe de cette approche est l' analyse des mélanges , également connue sous le nom de modèles de mélanges finis , dont la description dépasse le cadre de cette réponse). Transformation Box-Cox, brièvement mentionné dans les deux références ci-dessus, est une transformation de données assez importante, en particulier pour les données non normales (avec quelques mises en garde). Pour plus de détails sur la transformation Box-Cox, veuillez consulter cet article d'introduction .

— Aleksandr Blekh
source

2

Bonnes références Aleksandr. Merci d'avoir partagé ce sceptisisme bien nécessaire. Merci.

— Adam Robinsson

1

@AdamRobinsson: Mon plaisir, Adam! Heureux que vous ayez aimé ma réponse.

— Aleksandr Blekh

8

La transformation des journaux n'améliore PAS TOUJOURS les choses. De toute évidence, vous ne pouvez pas log-transformer des variables qui atteignent zéro ou des valeurs négatives, et même des variables positives qui étreignent zéro pourraient produire des valeurs aberrantes négatives si elles sont transformées en log.

Vous ne devez pas simplement tout enregistrer régulièrement, mais c'est une bonne pratique de PENSER à la transformation de prédicteurs positifs sélectionnés (de manière appropriée, souvent un journal mais peut-être autre chose) avant d'adapter un modèle. Il en va de même pour la variable de réponse. La connaissance du sujet est également importante. Une théorie de la physique ou de la sociologie ou quoi que ce soit pourrait naturellement conduire à certaines transformations. Généralement, si vous voyez des variables qui sont positivement asymétriques, c'est là qu'un journal (ou peut-être une racine carrée ou une réciproque) pourrait aider.

Certains textes de régression semblent suggérer que vous devez examiner les tracés de diagnostic avant d'envisager des transformations, mais je ne suis pas d'accord. Je pense qu'il vaut mieux faire le meilleur travail possible en faisant ces choix avant de monter n'importe quel modèle, afin d'avoir le meilleur point de départ possible; puis regardez les diagnostics pour voir si vous devez ajuster à partir de là.

— Russ Lenth
source

Tous ajoutent que ces considérations s'appliquent à la fois aux prédicteurs importants et sans importance.

— Russ Lenth

Merci @rvl! Je suis toujours confus par la discordance entre quand et comment choisir les transformations; les livres indiquent souvent que, comme vous l'avez écrit, il faut vérifier la forme de toutes les variables avant de toucher à la régression. Merci d'avoir fourni vos idées.

— Adam Robinsson

@rvl, merci pour votre réponse. Souhaitez-vous transformer en journal l' snoqensemble de données dans ce thread CrossValidated (en gardant à l'esprit que l'objectif est de faire correspondre un mélange de Gaussiens)?

— Zhubarb

-3

1) données de comptage (y> 0) -> log (y) ou y = exp (b0 + biXi) 2) données de comptage + zéro (y> = 0) -> modèle d'obstacle (binôme + rég. De comptage) 3) tous les effets multiplicateurs (et erreurs) seront additifs 4) variance ~ moyenne -> log (y) ou y = exp (b0 + biXi) 5) ...

— Ivan Kshnyasev
source

Cette réponse est difficile à lire et on ne sait pas si elle tente de répondre à la question.

— Juho Kokkala

1

T E X

$\TeX$

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.

Licensed under cc by-sa 3.0 with attribution required.