Je réalise une régression logistique avec variables indépendantes et observations. J'évalue l'ajustement du modèle afin de déterminer si les données répondent aux hypothèses du modèle et ont produit le tracé résiduel groupé suivant à l'aide du package:arm
R
Évidemment, il y a de mauvais signes dans ce graphique: de nombreux points se situent en dehors des bandes de confiance et il y a un modèle distinctif pour les résidus. Ma question est - puis-je attacher ces questions à des hypothèses spécifiques du modèle de régression logistique? Par exemple, puis-je dire qu'il existe des preuves de non-linéarité dans les variables indépendantes ou d'hétéroscédasticité? Sinon, existe-t-il d'autres diagnostics que je peux produire pour aider à identifier où se situe le problème?
Sur la base de la réponse de Daniel, il semble que le principal problème est que j'utilisais des résidus sur l'échelle logit mais des valeurs attendues sur l'échelle de réponse. Si je reproduis l'intrigue avec les résidus également sur l'échelle de réponse, cela ressemble à ceci:
ce qui est beaucoup plus crédible.