J'ai plusieurs centaines de mesures. Maintenant, je pense utiliser un logiciel pour corréler chaque mesure avec chaque mesure. Cela signifie qu'il existe des milliers de corrélations. Parmi ceux-ci, il devrait exister (statistiquement) une corrélation élevée, même si les données sont complètement aléatoires (chaque mesure n’a qu’une centaine de points de données).
Lorsque je trouve une corrélation, comment puis-je inclure les informations sur la difficulté avec laquelle j'ai cherché une corrélation?
Je ne suis pas à un niveau élevé en statistiques, alors s'il vous plaît, supportez-moi.
R
faut 18 secondes à @tmo sur cette machine pour obtenir 1 000 réalisations de la distribution de permutation nulle du coefficient de corrélation max pour une matrice de 300 par 100 x
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))