... la relation est non linéaire mais il existe une relation claire entre x et y, comment puis-je tester l'association et nommer sa nature?
Une façon de le faire serait d'adapter tant que fonction semi-paramétrée de utilisant, par exemple, un modèle additif généralisé et en vérifiant si cette estimation fonctionnelle est constante ou non, ce qui n'indiquerait aucune relation entre et . Cette approche vous évite d'avoir à effectuer une régression polynomiale et à prendre des décisions parfois arbitraires sur l'ordre du polynôme, etc.xyXxyX
Plus précisément, si vous avez des observations , vous pouvez adapter le modèle:( Yje, Xje)
E( Yje| Xje) = α + f( Xje) + εje
et testez l’hypothèse . Dans , vous pouvez le faire en utilisant la fonction. Si est votre résultat et votre prédicteur, vous pouvez taper:H0: f( X ) = 0 , ∀ x R
gam()
y
x
library(mgcv)
g <- gam(y ~ s(x))
En tapant summary(g)
, vous obtiendrez le résultat du test d'hypothèse ci-dessus. En ce qui concerne la nature de la relation, le mieux serait de le faire avec un complot. Une façon de faire cela R
(en supposant que le code ci-dessus ait déjà été entré)
plot(g,scheme=2)
Si votre variable de réponse est discrète (par exemple, binaire), vous pouvez intégrer cela dans ce cadre en adaptant un GAM logistique (dans R
, vous ajouteriez family=binomial
à votre appel à gam
). De même, si vous avez plusieurs prédicteurs, vous pouvez inclure plusieurs termes additifs (ou des termes linéaires ordinaires), ou adapter des fonctions à plusieurs variables, par exemple, si vous disposiez de prédicteurs . La complexité de la relation est automatiquement sélectionnée par validation croisée si vous utilisez les méthodes par défaut, bien qu'il y ait beaucoup de flexibilité ici - voir le fichier d'aide si cela vous intéresse.F( x , z)x, z
gam