Les tests statistiques ne font pas d'hypothèses sur la taille de l'échantillon. Il existe, bien sûr, des hypothèses différentes avec différents tests (par exemple, la normalité), mais l'égalité des tailles d'échantillon n'en fait pas partie. À moins que le test utilisé ne soit inapproprié d'une autre manière (je ne peux pas penser à un problème pour le moment), le taux d'erreur de type I ne sera pas affecté par des tailles de groupe considérablement inégales. De plus, leur formulation implique (à mon avis) qu'ils le croient. Ainsi, ils sont confus sur ces questions.
D'un autre côté, les taux d'erreur de type II seront fortement affectés par des s très inégaux . Cela sera vrai quel que soit le test (par exemple, le test t , le test U de Mann-Whitney ou le test z pour l'égalité des proportions seront tous affectés de cette manière). Pour un exemple de cela, voir ma réponse ici: Comment interpréter la comparaison des moyennes de différentes tailles d'échantillon? Ainsi, ils pourraient bien être "justifiés de jeter l'éponge" en ce qui concerne cette question. (Plus précisément, si vous vous attendez à obtenir un résultat non significatif, que l'effet soit réel ou non, quel est l'intérêt du test?) ntUz
À mesure que les tailles d'échantillon divergent, la puissance statistique converge vers . Ce fait conduit en fait à une suggestion différente, dont je soupçonne que peu de gens ont déjà entendu parler et auraient probablement du mal à obtenir les anciens examinateurs (aucune infraction prévue): une analyse du pouvoir de compromis . L'idée est relativement simple: dans toute analyse de puissance, α , β , n 1 , n 2 et la taille de l'effet d existent les uns par rapport aux autres. Après avoir spécifié tout sauf un, vous pouvez résoudre le dernier. En règle générale, les gens font ce qu'on appelle une analyse de puissance a priori , dans laquelle vous résolvez pour Nααβn1n2dN(vous supposez généralement ). D'un autre côté, vous pouvez fixer n 1 , n 2 et d , et résoudre pour α (ou de manière équivalente β ), si vous spécifiez le rapport entre les taux d'erreur de type I et de type II avec lesquels vous êtes prêt à vivre. Conventionnellement, α = 0,05 et β = 0,20 , vous dites donc que les erreurs de type I sont quatre fois pires que les erreurs de type I. Bien sûr, un chercheur donné pourrait être en désaccord avec cela, mais après avoir spécifié un rapport donné, vous pouvez résoudre ce que αn1=n2n1n2dαβα=.05β=.20αvous devez utiliser afin de maintenir éventuellement une puissance adéquate. Cette approche est une option logiquement valable pour les chercheurs dans cette situation, bien que je reconnaisse que l'exotisme de cette approche peut en faire une vente difficile dans la communauté de recherche plus large qui n'a probablement jamais entendu parler d'une telle chose.