Tests de signification des corrélations
Il existe des tests de signification statistique qui peuvent être appliqués aux corrélations individuelles, qui indiquent la probabilité d'obtenir une corrélation aussi grande ou plus grande que la corrélation de l'échantillon en supposant que l'hypothèse nulle est vraie.
Le point clé est que ce qui constitue un coefficient de corrélation statistiquement significatif dépend:
- Taille de l'échantillon : des tailles d'échantillon plus grandes entraîneront des seuils plus petits
- alpha : souvent fixé à 0,05, des alphas plus petits entraîneront des seuils de signification statistique plus élevés
- test unilatéral / bilatéral : je suppose que vous utiliseriez un système bilatéral, donc cela n'a probablement pas d'importance
- type de coefficient de corrélation : je suppose que vous utilisez Pearson
- hypothèses de distribution de x et y
Dans des circonstances courantes, où alpha est 0,05, en utilisant un test bilatéral, avec la corrélation de Pearson, et où la normalité est au moins une approximation adéquate, le principal facteur influençant le seuil est la taille de l'échantillon.
Seuil d'importance
Une autre façon d'interpréter votre question est de considérer que vous ne vous intéressez pas à la question de savoir si une corrélation est statistiquement significative, mais plutôt si elle est pratiquement importante.
Certains chercheurs ont proposé des règles empiriques pour interpréter la signification des coefficients de corrélation, mais ces règles empiriques sont spécifiques au domaine.
Test de signification multiple
Cependant, étant donné que vous souhaitez signaler des corrélations significatives dans une matrice, cela modifie le contexte inférentiel. Vous avez corrélations où est le nombre de variables (c.-à-d. Si l'hypothèse nulle était vraie pour toutes les corrélations dans la matrice, alors les tests de signification les plus importants que vous exécutez , alors plus vous êtes susceptible de commettre une erreur de type I. Par exemple, dans votre cas, vous feriez en moyenne erreurs de type I si l'hypothèse nulle était vraie pour toutes les corrélations.k ( k - 1 ) / 2k14 ( 13 ) / 2 = 9191 ∗ 0,05 = 4,55
Comme @ user603 l'a souligné, ces questions ont été bien discutées dans cette question précédente .
En général, je trouve utile lors de l'interprétation d'une matrice de corrélation de se concentrer sur une structure de niveau supérieur. Cela peut être fait de manière informelle en examinant les modèles généraux de la matrice de corrélation. Cela peut être fait de manière plus formelle en utilisant des techniques telles que l'ACP et l'analyse factorielle. De telles approches évitent bon nombre des problèmes associés aux tests de signification multiple.