J'ai des données pour deux groupes (c'est-à-dire des échantillons) que je souhaite comparer mais la taille totale de l'échantillon est petite (n = 29) et fortement déséquilibrée (n = 22 vs n = 7).
Ces données sont logistiquement difficiles et coûteuses à collecter, donc bien que «collecter plus de données» comme solution évidente ne soit pas utile dans ce cas.
Un certain nombre de variables différentes ont été mesurées (date de départ, date d'arrivée, durée de la migration, etc.), il y a donc plusieurs tests, dont certains les variances sont très différentes (le plus petit échantillon ayant une variance plus élevée).
Au départ, un collègue a effectué des tests t sur ces données, et certains étaient statistiquement significatifs avec P <0,001, un autre n'était pas significatif avec P = 0,069. Certains échantillons étaient normalement distribués, d'autres non. Certains tests ont impliqué des écarts importants par rapport aux variances «égales».
J'ai plusieurs questions:
- les tests t sont-ils appropriés ici? Sinon, pourquoi? Cela s'applique-t-il uniquement aux tests où les hypothèses de normalité et d'égalité des variances sont satisfaites?
- quelle (s) alternative (s) appropriée (s)? Peut-être un test de permutation?
- la variance inégale gonfle l'erreur de type I, mais comment? et quel effet la petite taille d'échantillon déséquilibrée a-t-elle sur l'erreur de type I?