Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
Linéarité de la PCA
La PCA est considérée comme une procédure linéaire, toutefois: PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), où . Cela revient à dire que les vecteurs propres obtenus par les PCA sur les matrices de données X i ne totalisent pas pour égaler les vecteurs propres obtenus par PCA sur la somme des matrices de données …
35 pca  linear 


2
Augmentation de gradient pour la régression linéaire - pourquoi cela ne fonctionne-t-il pas?
Lors de l'apprentissage de Gradient Boosting, je n'ai jamais entendu parler de contraintes concernant les propriétés d'un "classificateur faible" que la méthode utilise pour construire et modéliser un modèle. Cependant, je ne pouvais pas imaginer une application de Go utilisant une régression linéaire, et en fait, après avoir effectué certains …



3
Comment choisir une méthode de clustering? Comment valider une solution de cluster (pour justifier le choix de la méthode)?
L’un des problèmes les plus importants de l’analyse par grappes est qu’il peut arriver que nous devions tirer des conclusions différentes lorsque nous nous basons sur différentes méthodes de classification utilisées (y compris différentes méthodes de couplage dans une classification hiérarchique). J'aimerais connaître votre opinion à ce sujet - quelle …

5
Pensez comme un bayésien, vérifiez comme un fréquentiste: qu'est-ce que cela signifie?
Je regarde des diapositives de cours sur un cours de science des données que vous pouvez trouver ici: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Malheureusement, je ne peux pas voir la vidéo de cette conférence et à un moment de la diapositive, le présentateur a le texte suivant: Quelques principes clés Penser comme un Bayésien, …






1
Régression quantile: quelles erreurs-types?
La summary.rqfonction de la vignette quantreg fournit une multitude de choix pour les estimations d'erreur standard des coefficients de régression quantile. Quels sont les scénarios spéciaux où chacun devient optimal / souhaitable? "rang" qui produit des intervalles de confiance pour les paramètres estimés en inversant un test de rang tel …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.