Je sais que la taille de l'échantillon affecte la puissance dans n'importe quelle méthode statistique. Il existe des règles pour déterminer le nombre d'échantillons dont une régression a besoin pour chaque prédicteur.
J'entends aussi souvent que le nombre d'échantillons dans chaque catégorie dans la variable dépendante d'une régression logistique est important. Pourquoi est-ce?
Quelles sont les conséquences réelles sur le modèle de régression logistique lorsque le nombre d'échantillons dans l'une des catégories est petit (événements rares)?
Existe-t-il des règles empiriques qui intègrent à la fois le nombre de prédicteurs et le nombre d'échantillons à chaque niveau de la variable dépendante?