Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
Quel est le modèle approprié pour les données de comptage sous-dispersées?
J'essaie de modéliser les données de comptage dans R qui sont apparemment sous-dispersées (paramètre de dispersion ~ 0,40). C'est probablement pourquoi un modèle binomial ( ) glmavec family = poissonou négatif glm.nbn'est pas significatif. Quand je regarde les descriptions de mes données, je n'ai pas le biais typique des données …

5
Module Python pour l'analyse des points de changement
Je recherche un module Python qui effectue une analyse de point de changement sur une série chronologique. Il existe un certain nombre d'algorithmes différents et j'aimerais explorer l'efficacité de certains d'entre eux sans avoir à lancer manuellement chacun des algorithmes. Idéalement, j'aimerais que certains modules comme les paquets bcp (Bayesian …


3
Carte des fonctionnalités du noyau gaussien
Dans SVM, le noyau gaussien est défini comme: où x, y \ in \ mathbb {R ^ n} . Je ne connais pas l'équation explicite de \ phi . Je veux le savoir.K( x , y) = exp( - ∥ x - y∥222 σ2) =ϕ(x )Tϕ ( y)K(X,y)=exp⁡(-‖X-y‖222σ2)=ϕ(X)Tϕ(y)K(x,y)=\exp\left({-\frac{\|x-y\|_2^2}{2\sigma^2}}\right)=\phi(x)^T\phi(y)x , y∈ …

4
Comment déterminer les quantiles (isolignes?) D'une distribution normale multivariée
Je m'intéresse à la façon de calculer un quantile d'une distribution multivariée. Dans les figures, j'ai tracé les quantiles 5% et 95% d'une distribution normale univariée donnée (à gauche). Pour la bonne distribution normale multivariée, j'imagine qu'un analogue serait une isoline qui entoure la base de la fonction de densité. …



2
Pouvez-vous expliquer l'estimation de la densité de la fenêtre de Parzen (noyau) en termes simples?
L'estimation de la densité de fenêtre de Parzen est décrite comme p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) où est le nombre d'éléments dans le vecteur, x est un vecteur, p ( x ) est une densité de probabilité de x , h est la dimension de la fenêtre …

3
Que sont les «coefficients aliasés»?
Lors de la construction d'un modèle de régression dans R ( lm), je reçois fréquemment ce message "there are aliased coefficients in the model" Qu'est-ce que ça veut dire exactement? En outre, à cause de cela, predict()donne également un avertissement. Bien que ce ne soit qu'un avertissement, je veux savoir …
24 r  regression 


1
Kolmogorov-Smirnov avec des données discrètes: Quelle est la bonne utilisation de dgof :: ks.test dans R?
Questions pour débutants: Je veux tester si deux ensembles de données discrets proviennent de la même distribution. Un test de Kolmogorov-Smirnov m'a été proposé. Conover ( Practical Nonparametric Statistics , 3d) semble dire que le test de Kolmogorov-Smirnov peut être utilisé à cette fin, mais son comportement est "conservateur" avec …

1
F1 / Dice-Score vs IoU
J'étais confus quant aux différences entre le score F1, le score Dice et IoU (intersection sur l'union). À ce jour, j'ai découvert que F1 et Dice signifient la même chose (non?) Et IoU a une formule très similaire aux deux autres. F1 / Dés:2 TP2 TP+ FP+ FN2TP2TP+FP+FN\frac{2TP}{2TP+FP+FN} IoU / …

2
Pourquoi lambda «dans une erreur standard du minimum» est-il une valeur recommandée pour lambda dans une régression nette élastique?
Je comprends le rôle que joue lambda dans une régression élastique-nette. Et je peux comprendre pourquoi on sélectionnerait lambda.min, la valeur de lambda qui minimise l'erreur de validation croisée. Ma question est: où dans la littérature statistique est-il recommandé d'utiliser lambda.1se, quelle est la valeur de lambda qui minimise l'erreur …

2
Quelle est la différence entre abandon et drop connect?
Quelle est la différence entre abandon et drop connect? AFAIK, le décrochage supprime aléatoirement les nœuds cachés pendant la formation, mais les maintient dans les tests, et le drop connect supprime les connexions. Mais la suppression des connexions n'est-elle pas équivalente à la suppression des nœuds cachés? Les nœuds (ou …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.