Questions marquées «pca»

L'analyse en composantes principales (ACP) est une technique de réduction de dimensionnalité linéaire. Il réduit un ensemble de données multivarié à un plus petit ensemble de variables construites en préservant autant d'informations (autant de variance) que possible. Ces variables, appelées composantes principales, sont des combinaisons linéaires des variables d'entrée.

3
L'optimisation PCA est-elle convexe?
La fonction objective de l'analyse en composantes principales (ACP) minimise l'erreur de reconstruction dans la norme L2 (voir la section 2.12 ici . Une autre vue essaie de maximiser la variance sur la projection. Nous avons également un excellent article ici: Quelle est la fonction objective de l'ACP ? ). …

3
Pourquoi utilisons-nous PCA pour accélérer les algorithmes d'apprentissage alors que nous pourrions simplement réduire le nombre de fonctionnalités?
Dans un cours de machine learning, j'ai appris qu'une utilisation courante de PCA ( Principal Component Analysis ) est d'accélérer d'autres algorithmes de machine learning. Par exemple, imaginez que vous entraînez un modèle de régression logistique. Si vous avez un ensemble d'apprentissage pour i de 1 à n et qu'il …


4
Sélection du modèle PCA avec AIC (ou BIC)
Je souhaite utiliser le critère d'information Akaike (AIC) pour choisir le nombre approprié de facteurs à extraire dans une ACP. Le seul problème est que je ne sais pas comment déterminer le nombre de paramètres. Considérons une matrice X , où N représente le nombre de variables et T le …

2
PCA et forêts aléatoires
Pour un récent concours Kaggle, j'ai (manuellement) défini 10 fonctionnalités supplémentaires pour mon ensemble d'entraînement, qui seraient ensuite utilisées pour former un classificateur de forêts aléatoires. J'ai décidé d'exécuter PCA sur l'ensemble de données avec les nouvelles fonctionnalités, pour voir comment elles se comparaient les unes aux autres. J'ai trouvé …

5
Puis-je utiliser PCA pour effectuer une sélection de variables pour l'analyse de cluster?
Je dois réduire le nombre de variables pour effectuer une analyse de cluster. Mes variables sont fortement corrélées, j'ai donc pensé faire une analyse factorielle PCA (analyse en composantes principales). Cependant, si j'utilise les scores obtenus, mes grappes ne sont pas tout à fait correctes (par rapport aux classifications précédentes …

2
Que maximisent les premiers facteurs de l'analyse factorielle?
Dans l'analyse des composantes principales, les premières composantes principales sont les directions orthogonales avec la variance maximale. En d'autres termes, la première composante principale est choisie pour être la direction de la variance maximale, la deuxième composante principale est choisie pour être la direction orthogonale à la première avec la …





2
Les solutions PCA sont-elles uniques?
Lorsque j'exécute PCA sur un certain ensemble de données, la solution qui m'est donnée est-elle unique? C'est-à-dire que j'obtiens un ensemble de coordonnées 2d, basé sur des distances entre points. Est-il possible de trouver au moins une autre disposition des points qui répondrait à ces contraintes? Si la réponse est …
12 pca 

4
Comment réaliser l'ACP pour des données de très grande dimensionnalité?
Pour effectuer une analyse en composantes principales (ACP), vous devez soustraire la moyenne de chaque colonne des données, calculer la matrice des coefficients de corrélation, puis trouver les vecteurs propres et les valeurs propres. Eh bien, c'est plutôt ce que j'ai fait pour l'implémenter en Python, sauf qu'il ne fonctionne …
12 pca  python 


3
Y a-t-il une valeur dans la réduction de dimensionnalité d'un ensemble de données où toutes les variables sont approximativement orthogonales?
Supposons que j'ai un ensemble de données à dimensions où les N dimensions sont à peu près orthogonales (ont une corrélation nulle).NNNNNN Existe-t-il une utilité en termes de: Visualisation Représentation (pour l'efficacité du classificateur) Ou d'autres critères effectuer une réduction de dimensionnalité sur les données?

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.