Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

1
Explication du facteur de correction fini
Je comprends que lors de l'échantillonnage à partir d'une population finie et que notre taille d'échantillon est supérieure à 5% de la population, nous devons corriger la moyenne et l'erreur standard de l'échantillon à l'aide de cette formule: FPC= N- nN- 1----√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} Où est la taille de la population …



3
Quels sont les avantages de la métrique Wasserstein par rapport à la divergence Kullback-Leibler?
Quelle est la différence pratique entre la métrique de Wasserstein et la divergence de Kullback-Leibler ? La métrique de Wasserstein est également appelée distance du moteur de la Terre . De Wikipédia: La métrique de Wasserstein (ou Vaserstein) est une fonction de distance définie entre les distributions de probabilité sur …

2
Comment fonctionne la régression quantile?
J'espère obtenir une explication intuitive et accessible de la régression quantile. Disons que j'ai un simple ensemble de données du résultat YYY et des prédicteurs X1,X2X1,X2X_1, X_2 . Si, par exemple, je lance une régression quantile à .25, .5, .75, et récupère .β0,.25,β1,.25...β2,.75β0,.25,β1,.25...β2,.75\beta_{0,.25},\beta_{1,.25}...\beta_{2,.75} Les valeurs trouvées simplement en ordonnant les …

3
Analyse quotidienne des séries chronologiques
J'essaie de faire une analyse des séries chronologiques et je suis nouveau dans ce domaine. J'ai un décompte quotidien d'un événement de 2006-2009 et je veux y adapter un modèle de série chronologique. Voici les progrès que j'ai réalisés: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) L'intrigue résultante que j'obtiens est: Afin de …


3
Interprétation des termes d'interaction dans la régression logit avec des variables catégorielles
J'ai des données d'une expérience d'enquête dans laquelle les répondants ont été assignés au hasard à l'un des quatre groupes: > summary(df$Group) Control Treatment1 Treatment2 Treatment3 59 63 62 66 Bien que les trois groupes de traitement varient légèrement dans le stimulus appliqué, la principale distinction qui m'importe est entre …

5
Introduction à l'analyse causale
Quels sont les bons livres qui introduisent l'analyse causale? Je pense à une introduction qui explique à la fois les principes de l'analyse causale et montre comment différentes méthodes statistiques pourraient être utilisées pour appliquer ces principes.







En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.