Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
Est-ce la solution au problème de la valeur p?
En février 2016, l'American Statistical Association a publié une déclaration officielle sur la signification statistique et les valeurs p. Notre fil à ce sujet traite de ces questions en détail. Cependant, aucune autorité n’a été proposée pour offrir une alternative efficace universellement reconnue - jusqu’à présent. L'American Statistical Society (ASS) …

2
Quelle est la relation entre l'analyse en composantes indépendantes et l'analyse factorielle?
Je suis novice en Analyse de Composants Indépendants (ICA) et n’ai qu’une compréhension rudimentaire de la méthode. Il me semble que l’ACI est semblable à l’analyse factorielle (AF) à une exception près: l’ACI suppose que les variables aléatoires observées sont une combinaison linéaire de composants / facteurs indépendants non gaussiens, …

10
Existe-t-il une base * mathématique * pour le débat bayésien vs fréquentiste?
Il est dit sur Wikipedia que: les mathématiques [de probabilité] sont largement indépendantes de toute interprétation de probabilité. Question: Alors, si nous voulons être mathématiquement corrects, ne devrions-nous pas rejeter toute interprétation de la probabilité? C'est-à-dire que le bayésien et le fréquentisme sont mathématiquement incorrects? Je n'aime pas la philosophie, …




5
Comment exactement les statisticiens ont-ils accepté d'utiliser (n-1) comme estimateur sans biais pour la variance de population sans simulation?
La formule de calcul de la variance a au dénominateur:( n - 1 )(n−1)(n-1) s2= ΣNi = 1( xje- x¯)2n - 1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Je me suis toujours demandé pourquoi. Cependant, lire et regarder quelques bonnes vidéos sur le "pourquoi", il semble que soit un bon estimateur …


5
Chargements vs vecteurs propres dans PCA: quand utiliser l'un ou l'autre?
En analyse en composantes principales (ACP), nous obtenons des vecteurs propres (vecteurs unitaires) et des valeurs propres. Maintenant, définissons les charges comme Loadings=Eigenvectors⋅Eigenvalues−−−−−−−−−−√.Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. Je sais que les vecteurs propres ne sont que des directions et que les chargements (tels que définis ci-dessus) incluent également la variance …
67 pca 


1
Quelle corrélation rend une matrice singulière et quelles sont les implications de la singularité ou de la quasi-singularité?
Je fais des calculs sur différentes matrices (principalement dans la régression logistique) et je reçois généralement l'erreur "Matrix is ​​singular", où je dois revenir en arrière et supprimer les variables corrélées. Ma question est la suivante: que considéreriez-vous comme une matrice "fortement" corrélée? Existe-t-il une valeur seuil de corrélation pour …

4
Regardez et vous trouverez (une corrélation)
J'ai plusieurs centaines de mesures. Maintenant, je pense utiliser un logiciel pour corréler chaque mesure avec chaque mesure. Cela signifie qu'il existe des milliers de corrélations. Parmi ceux-ci, il devrait exister (statistiquement) une corrélation élevée, même si les données sont complètement aléatoires (chaque mesure n’a qu’une centaine de points de …

7
Combien payer? Un problème pratique
Ce n'est pas une question de travail à domicile mais un problème réel auquel notre entreprise est confrontée. Très récemment (il y a 2 jours), nous avons commandé la fabrication de 10 000 étiquettes de produits à un revendeur. Le concessionnaire est une personne indépendante. Il fait fabriquer les étiquettes …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.