Supposons que j'ai trois populations avec quatre caractéristiques mutuellement exclusives. Je prélève des échantillons aléatoires dans chaque population et crée un tableau croisé ou un tableau de fréquences pour les caractéristiques que je mesure. Ai-je raison de dire que:
Si je voulais vérifier s'il existait une relation entre les populations et leurs caractéristiques (par exemple, si une population présentait une fréquence plus élevée de l'une de ces caractéristiques), je devrais faire un test du khi-carré et voir si le résultat était significatif.
Si le test du khi-carré est significatif, il ne fait que me montrer qu'il existe une relation entre les populations et leurs caractéristiques, mais pas la relation entre elles.
En outre, toutes les caractéristiques ne doivent pas nécessairement être liées à la population. Par exemple, si les distributions des caractéristiques A et B, mais pas celles de C et D, sont très différentes les unes des autres, le test du khi-carré peut encore être considéré comme significatif.
Si je veux mesurer si une caractéristique spécifique est affectée par la population, je peux alors exécuter un test pour des proportions égales (j'ai vu cela appelé un test z, ou comme
prop.test()
dansR
) sur cette caractéristique uniquement.
En d’autres termes, convient-il d’utiliser le prop.test()
pour déterminer avec plus de précision la nature d’une relation entre deux ensembles de catégories lorsque le test du khi-carré indique qu’il existe une relation significative?