Je sais que dans une situation de régression, si vous avez un ensemble de variables hautement corrélées, cela est généralement "mauvais" en raison de l'instabilité des coefficients estimés (la variance va vers l'infini car le déterminant va vers zéro).
Ma question est de savoir si cette «méchanceté» persiste dans une situation de PCA. Les coefficients / charges / poids / vecteurs propres pour un PC particulier deviennent-ils instables / arbitraires / non uniques lorsque la matrice de covariance devient singulière? Je m'intéresse particulièrement au cas où seule la première composante principale est conservée, et toutes les autres sont rejetées comme "bruit" ou "autre chose" ou "sans importance".
Je ne pense pas que ce soit le cas, car il vous restera juste quelques composants principaux qui ont une variance nulle ou proche de zéro.
Facile à voir, ce n'est pas le cas dans le cas extrême simple avec 2 variables - supposons qu'elles soient parfaitement corrélées. Ensuite, le premier PC sera la relation linéaire exacte, et le deuxième PC sera perpindiculaire au premier PC, avec toutes les valeurs de PC égales à zéro pour toutes les observations (c.-à-d. Variance nulle). Vous vous demandez si c'est plus général.