Existe-t-il une procédure standard (telle que l'on pourrait la citer comme référence) pour sélectionner le sous-ensemble de points de données dans un pool plus large avec la corrélation la plus forte (le long de deux dimensions seulement)?
Par exemple, supposons que vous ayez 100 points de données. Vous voulez un sous-ensemble de 40 points avec la plus forte corrélation possible le long des dimensions X et Y.
Je me rends compte que l'écriture de code pour ce faire serait relativement simple, mais je me demande s'il y a une source à citer pour cela?