Dans un problème sur lequel je travaille, j'ai deux variables aléatoires, X et Y. J'ai besoin de comprendre à quel point elles sont étroitement corrélées, mais elles sont de dimensions différentes. Le rang de l'espace de rangée de X est 4350, et le rang de l'espace de rangée de Y est sensiblement plus grand, dans les dizaines de milliers. X et Y ont le même nombre de colonnes.
J'ai besoin d'une mesure de corrélation entre les deux variables, et le r de Pearson nécessite que X et Y aient une dimension égale (au moins R nécessite que les deux rv soient).
Ai-je le moindre espoir de faire une corrélation entre ces deux, ou devrais-je trouver un moyen d'élaguer les observations de Y?
EDIT
Ajout d'informations à partir des commentaires, qui devraient être dans la question.
Je suppose que j'ai oublié de le mentionner. X et Y sont des cours boursiers. La société X est publique depuis une période beaucoup plus courte que Y. Je voulais dire à quel point les prix de X et Y sont corrélés. Je pourrais certainement obtenir une corrélation pour la période de temps pendant laquelle X et Y existent tous les deux. Je voulais savoir si connaître le cours des actions pour plusieurs années supplémentaires de Y que X n'existait pas m'a fourni des informations supplémentaires.