J'ai appris le PCA il y a quelques conférences en classe et en approfondissant ce concept fascinant, j'ai appris à connaître le PCA clairsemé.
Je voulais demander, si je ne me trompe pas, c'est ce que l'APC est clairsemée: Dans l'APC, si vous avez points de données avec variables, vous pouvez représenter chaque point de données dans espace dimensionnel avant d'appliquer l'APC. Après avoir appliqué l'ACP, vous pouvez à nouveau le représenter dans le même espace dimensionnel, mais, cette fois, le premier composant principal contiendra le plus de variance, le second contiendra la deuxième direction de variance et ainsi de suite. Vous pouvez donc éliminer les derniers composants principaux, car ils ne causeront pas beaucoup de pertes de données et vous pouvez compresser les données. Droite?
L'ACP éparse sélectionne les composants principaux de telle sorte que ces composants contiennent moins de valeurs non nulles dans leurs coefficients vectoriels.
Comment cela est-il censé vous aider à mieux interpréter les données? Quelqu'un peut-il donner un exemple?