Je procède à une régression logistique avec un résultat binaire (démarrage et non démarrage). Ma combinaison de prédicteurs sont toutes des variables continues ou dichotomiques.
En utilisant l'approche Box-Tidwell, l'un de mes prédicteurs continus viole potentiellement l'hypothèse de linéarité du logit. Rien dans les statistiques de qualité de l'ajustement n'indique que l'ajustement est problématique.
J'ai ensuite exécuté à nouveau le modèle de régression, en remplaçant la variable continue d'origine par: premièrement, une transformation de racine carrée et deuxièmement, une version dichotomique de la variable.
Lors de l'inspection de la sortie, il semble que la qualité de l'ajustement s'améliore légèrement mais les résidus deviennent problématiques. Les estimations de paramètres, les erreurs standard et restent relativement similaires. L'interprétation des données ne change pas selon mon hypothèse, à travers les 3 modèles.
Par conséquent, en termes d'utilité de mes résultats et de sens d'interprétation des données, il semble approprié de rapporter le modèle de régression en utilisant la variable continue d'origine.
Je me demande ceci:
- Quand la régression logistique est-elle robuste contre la violation potentielle de la linéarité de l'hypothèse logit?
- Compte tenu de mon exemple ci-dessus, semble-t-il acceptable d'inclure la variable continue d'origine dans le modèle?
- Existe-t-il des références ou des guides pour recommander lorsqu'il est satisfaisant d'accepter que le modèle est robuste contre la violation potentielle de la linéarité du logit?