Je veux faire une régression linéaire multiple puis prédire de nouvelles valeurs avec peu d'extrapolation. J'ai ma variable de réponse dans la plage de -2 à +7 et trois prédicteurs (les plages d'environ +10 à +200). La distribution est presque normale. Mais la relation entre la réponse et les prédicteurs n'est pas linéaire, je vois des courbes sur les graphiques. Par exemple, comme ceci: http://cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg
Je voudrais appliquer une transformation pour atteindre la linéarité. J'ai essayé de transformer la variable de réponse en vérifiant différentes fonctions et en regardant les graphiques résultants pour voir une relation linéaire entre la réponse et les prédicteurs. Et j'ai trouvé qu'il existe de nombreuses fonctions qui peuvent me donner une relation linéaire visible. Par exemple, les fonctions
etc. donnent les mêmes résultats: http://cs10418.userapi.com/u17020874/153949434/x_06f13dbf.jpg
Après je vais retransformer les valeurs prédites (pour commey′=1et ainsi de suite). Les distributions sont plus ou moins similaires à la normale.
Comment choisir la meilleure transformation pour mes données? Existe-t-il une manière quantitative (et pas très compliquée) d'évaluer la linéarité? Pour prouver que la transformation sélectionnée est la meilleure ou pour la trouver automatiquement si possible.
Ou la seule façon est de faire la régression multiple non linéaire?
plot(lm(1/(y+5)~r))