Disons que je construis un modèle de régression logistique où la variable dépendante est binaire et peut prendre les valeurs ou . Soit les variables indépendantes - il y a variables indépendantes. Disons que pour lee variable indépendante, l'analyse bivariée montre une tendance en forme de U - c'est-à-dire si je dans bacs contenant chacun un nombre à peu près égal d'observations et calculant le `` mauvais taux '' pour chaque bac - # observations où y = 0 / total des observations dans chaque bac - alors j'obtiens une courbe en U.
Mes questions sont:
- Puis-je utiliser directement comme entrée lors de l'estimation des paramètres bêta? Des hypothèses statistiques ont-elles été violées, ce qui pourrait entraîner une erreur significative dans l'estimation des paramètres?
- Faut-il «linéariser» cette variable par une transformation (log, carré, produit avec lui-même, etc.)?