@whuber a donné une excellente réponse ici. Je veux juste ajouter un petit point complémentaire. La question indique qu '"une relation linéaire entre prédicteur et données n'est pas interprétable". Cela suggère un malentendu courant, même si je l’entends généralement à l’autre bout («quelle est l’interprétation du terme carré [cubique, etc.]?»).
Lorsque nous avons un modèle avec plusieurs covariables différentes , chaque beta (terme) peut généralement avoir sa propre interprétation. Par exemple, si:
GPAˆcollege=β0+β1GPAhighschool+β2class rank+β3SAT,
(GPA signifie moyenne générale; le
rang correspond au classement de la moyenne pondérée d'un étudiant par rapport à d'autres étudiants du même lycée; &
SAT signifie 'test d'aptitude à la scolarité ', test national standard pour les étudiants qui vont à l'université)
nous pouvons alors attribuer des interprétations distinctes à chaque bêta / terme. Par exemple, si la GPA d'un élève au secondaire était supérieure d'un point - toutes choses étant égales par ailleurs -, on s'attendrait à ce que sa GPA au collège soit de points plus élevé. β1
Il est toutefois important de noter qu’il n’est pas toujours possible d’interpréter un modèle de cette manière. Un cas évident est le cas où il existe une interaction entre certaines variables, car il ne serait pas possible que le terme individuel diffère et que tout le reste soit maintenu constant - le terme d’interaction changerait également. Ainsi, quand il y a interaction, nous n'interprétons pas les effets principaux mais seulement les effets simples , comme il est bien compris.
La situation avec les termes de pouvoir est directement analogue, mais malheureusement, elle ne semble pas être comprise largement. Considérez le modèle suivant:
(Dans cette situation, est destiné à représenter une covariable prototypique continue.) Il n’est pas possible que change sans que change également, et vice versa. En termes simples, quand un modèle contient des termes polynômes, les différents termes basés sur la même covariable sous-jacente ne peuvent pas être interprétés séparément. Le terme ( , , etc.) n'a pas de signification indépendante. Le fait que
y^=β0+β1x+β2x2
xxx2x2xx17pLe terme polynomial -power est "significatif" dans un modèle indique qu'il existe "courbures" dans la fonction reliant et . Il est regrettable, mais inévitable, que lorsque la courbure existe, l'interprétation devienne plus compliquée et peut-être moins intuitive. Pour évaluer le changement de lorsque change, nous devrons utiliser le calcul. La dérivée du modèle ci-dessus est:
qui correspond au taux de variation instantané de la valeur attendue de lorsque change, toutes choses égales par ailleurs. Ce n’est pas aussi net que l’interprétation du très haut modèle; surtout, le taux de changement instantané de
p−1xyy^x
dydx=β1+2β2x
yxy dépend du niveau de partir duquel le changement est évaluéx . De plus, le taux de variation de est un taux instantané; c'est-à-dire qu'il est lui-même en constante évolution tout au long de l'intervalle de à . C’est tout simplement la nature d’une relation curviligne.
yxoldxnew