Dans le cadre d'une proposition de recherche en sciences sociales, on m'a posé la question suivante:
J'ai toujours choisi 100 + m (m étant le nombre de prédicteurs) lors de la détermination de la taille minimale de l'échantillon pour la régression multiple. Est-ce approprié?
Je reçois beaucoup de questions similaires, souvent avec des règles différentes. J'ai aussi souvent lu de telles règles empiriques dans divers manuels. Je me demande parfois si la popularité d'une règle en termes de citations est basée sur le niveau bas de la norme. Cependant, je suis également conscient de l'intérêt d'une bonne heuristique pour simplifier la prise de décision.
Des questions:
- Quelle est l'utilité de simples règles empiriques pour la taille minimale des échantillons dans le contexte des chercheurs appliqués qui conçoivent des études de recherche?
- Suggérez-vous une règle de base alternative pour la taille minimale de l'échantillon pour la régression multiple?
- Sinon, quelles stratégies alternatives suggéreriez-vous pour déterminer la taille minimale de l'échantillon pour la régression multiple? En particulier, il serait bon d’attribuer une valeur au degré auquel une stratégie peut facilement être appliquée par un non-statisticien.