Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données



1
Quelle est la différence entre l'échantillonnage Metropolis Hastings, Gibbs, Importance et Rejection?
J'ai essayé d'apprendre les méthodes MCMC et j'ai découvert l'échantillonnage de Hastings, Gibbs, Importance et Reject dans Metropolis. Certaines de ces différences sont évidentes, c’est-à-dire que Gibbs est un cas particulier de Metropolis Hastings lorsque nous avons les conditions complètes, alors que d’autres sont moins évidentes, comme lorsque nous voulons …

6
Comment les scientifiques ont-ils calculé la forme de la fonction de densité de probabilité de distribution normale?
C’est probablement une question d’amateur, mais je voudrais savoir comment les scientifiques ont conçu la forme de la fonction de densité de probabilité de distribution normale. En gros, ce qui me dérange, c’est que, pour quelqu'un, il serait peut-être plus intuitif que la fonction de probabilité de données normalement distribuées …

6
Pourquoi le dénominateur de l'estimateur de covariance ne serait-il pas n-2 plutôt que n-1?
Le dénominateur de l'estimateur de variance (non biaisé) est car il y a observations et un seul paramètre est estimé.nn−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Dans le même esprit, je me demande pourquoi le dénominateur de la covariance ne serait pas lorsque deux paramètres sont estimés?n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}



2
Dans quelle mesure les intervalles de confiance des objets lmer sont-ils fiables dans le paquet d'effets?
Effectspackage fournit un moyen très rapide et pratique pour tracer les résultats de modèle à effets mixtes linéaires obtenus par lme4package . leeffect fonction calcule très rapidement les intervalles de confiance (IC), mais dans quelle mesure ces intervalles de confiance sont-ils fiables? Par exemple: library(lme4) library(effects) library(ggplot) data(Pastes) fm1 <- …



4
Comment interpréter les coefficients d'un ajustement de modèle polynomial?
J'essaie de créer un ajustement polynomial du second ordre à certaines données que j'ai. Disons que je trace cette correspondance avec ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Je reçois: Ainsi, un ajustement de deuxième ordre fonctionne assez bien. Je le calcule avec R: summary(lm(data$bar ~ poly(data$foo, …

5
La valeur p est-elle essentiellement inutile et dangereuse à utiliser?
Cet article du New York Times " Les chances, continuellement mises à jour" a attiré mon attention. Pour être bref, il est écrit que [Les statistiques bayésiennes] se révèlent particulièrement utiles pour aborder des problèmes complexes, y compris des recherches telles que celle utilisée par la Garde côtière en 2013 …


3
Comment dériver une matrice de coefficients de variance-covariance en régression linéaire
Je lis un livre sur la régression linéaire et j’ai du mal à comprendre la matrice de variance-covariance de :bb\mathbf{b} Les éléments en diagonale sont assez faciles, mais les éléments en diagonale sont un peu plus difficiles. Ce qui me laisse perplexe, c'est que σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1 \sigma(b_0, b_1) = E(b_0 b_1) …
36 regression 

5
La signification de «dépendance positive» comme condition pour utiliser la méthode habituelle de contrôle FDR
Benjamini et Hochberg ont mis au point la première méthode (et toujours la plus largement utilisée, selon moi) pour contrôler le taux de fausses découvertes (FDR). Je veux commencer par un groupe de valeurs P, chacune pour une comparaison différente, et décider quelles sont suffisamment basses pour être appelées une …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.