J'ajuste une régression logistique pas à pas sur un ensemble de données dans SPSS. Dans la procédure, j'adapte mon modèle à un sous-ensemble aléatoire qui est d'env. 60% de l'échantillon total, soit environ 330 cas.
Ce que je trouve intéressant, c'est que chaque fois que je rééchantillonne mes données, différentes variables apparaissent et disparaissent dans le modèle final. Quelques prédicteurs sont toujours présents dans le modèle final, mais d'autres apparaissent et sortent en fonction de l'échantillon.
Ma question est la suivante. Quelle est la meilleure façon de gérer cela? J'espérais voir la convergence des variables prédictives, mais ce n'est pas le cas. Certains modèles ont un sens beaucoup plus intuitif d'un point de vue opérationnel (et seraient plus faciles à expliquer aux décideurs), et d'autres ajustent légèrement les données.
En bref, comme les variables se déplacent, comment recommanderiez-vous de gérer ma situation?
Merci d'avance.