Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


2
Qu'est-ce que la distribution quasi-binomiale (dans le contexte du GLM)?
J'espère que quelqu'un pourra fournir un aperçu intuitif de ce qu'est la distribution quasi-binomiale et de ce qu'elle fait. Je suis particulièrement intéressé par ces points: En quoi le quasibinôme diffère de la distribution binomiale. Lorsque la variable de réponse est une proportion (les valeurs d'exemple incluent 0,23, 0,11, 0,78, …


2
comparaison lme et lmer
Je me demandais si quelqu'un pouvait m'éclairer sur les différences actuelles entre ces deux fonctions. J'ai trouvé la question suivante: Comment choisir la bibliothèque nlme ou lme4 R pour les modèles d'effets mixtes? , mais cela remonte à quelques années. C'est toute une vie dans les cercles logiciels. Mes questions …

8
Quelles matières mathématiques suggéreriez-vous pour préparer l'exploration de données et l'apprentissage automatique?
J'essaie de mettre en place un programme de mathématiques autogéré pour préparer l'apprentissage du data mining et du machine learning. Cela est motivé par le démarrage du cours d'apprentissage automatique d'Andrew Ng sur Coursera et le sentiment qu'avant de continuer, je devais améliorer mes compétences en mathématiques. J'ai obtenu mon …


1
Quand la fonction de distribution binomiale est-elle supérieure / inférieure à sa fonction de distribution de Poisson limite?
Soit B(n,p,r)B(n,p,r)B(n,p,r) la fonction de distribution binomiale (DF) avec les paramètres n∈Nn∈Nn \in \mathbb N et p∈(0,1)p∈(0,1)p \in (0,1) évalués à r∈{0,1,…,n}r∈{0,1,…,n}r \in \{0,1,\ldots,n\} : et soit dénotons le Poisson DF avec le paramètre évalué à r \ in \ {0,1,2, \ ldots \} : F(ν,r)a∈R+r∈{0,1,2,…}F(a,r)=e-ar ∑ i=0ajeB(n,p,r)=∑i=0r(ni)pi(1−p)n−i,B(n,p,r)=∑i=0r(ni)pi(1−p)n−i,\begin{equation} B(n,p,r) = …



4
Comment effectuer une réduction de dimensionnalité avec PCA dans R
J'ai un grand ensemble de données et je veux effectuer une réduction de dimensionnalité. Maintenant, partout où je lis, je peux utiliser PCA pour cela. Cependant, je ne semble toujours pas savoir quoi faire après le calcul / l'exécution de l'ACP. Dans R, cela se fait facilement avec la commande …
30 r  pca 





3
Comment savoir si une série chronologique est stationnaire ou non stationnaire?
J'utilise R, je cherchai sur Google et appris que kpss.test(), PP.test()et adf.test()sont utilisées pour savoir sur stationnarité des séries chronologiques. Mais je ne suis pas un statisticien, qui peut interpréter leurs résultats > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.