Statistiques et Big Data

3

Quel est le modèle approprié pour les données de comptage sous-dispersées?

J'essaie de modéliser les données de comptage dans R qui sont apparemment sous-dispersées (paramètre de dispersion ~ 0,40). C'est probablement pourquoi un modèle binomial ( ) glmavec family = poissonou négatif glm.nbn'est pas significatif. Quand je regarde les descriptions de mes données, je n'ai pas le biais typique des données …

24 r poisson-distribution negative-binomial beta-binomial underdispersion

5

Module Python pour l'analyse des points de changement

Je recherche un module Python qui effectue une analyse de point de changement sur une série chronologique. Il existe un certain nombre d'algorithmes différents et j'aimerais explorer l'efficacité de certains d'entre eux sans avoir à lancer manuellement chacun des algorithmes. Idéalement, j'aimerais que certains modules comme les paquets bcp (Bayesian …

24 time-series python change-point

2

Erreur de pourcentage absolu moyen (MAPE) dans Scikit-learn [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Vous souhaitez améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . Comment pouvons-nous calculer l'erreur de pourcentage absolu moyen (MAPE) de …

24 predictive-models python scikit-learn mape

3

Carte des fonctionnalités du noyau gaussien

Dans SVM, le noyau gaussien est défini comme: où x, y \ in \ mathbb {R ^ n} . Je ne connais pas l'équation explicite de \ phi . Je veux le savoir.K( x , y) = exp( - ∥ x - y∥222 σ2) =ϕ(x )Tϕ ( y)K(X,y)=exp⁡(-‖X-y‖222σ2)=ϕ(X)Tϕ(y)K(x,y)=\exp\left({-\frac{\|x-y\|_2^2}{2\sigma^2}}\right)=\phi(x)^T\phi(y)x , y∈ …

24 machine-learning svm kernel-trick

4

Comment déterminer les quantiles (isolignes?) D'une distribution normale multivariée

Je m'intéresse à la façon de calculer un quantile d'une distribution multivariée. Dans les figures, j'ai tracé les quantiles 5% et 95% d'une distribution normale univariée donnée (à gauche). Pour la bonne distribution normale multivariée, j'imagine qu'un analogue serait une isoline qui entoure la base de la fonction de densité. …

24 r pdf quantiles multivariate-normal multivariate-distribution

6

Introduction à la modélisation d'équations structurelles

Des collègues me demandent de l'aide à ce sujet, que je ne connais pas vraiment. Ils ont fait des hypothèses sur le rôle de certaines variables latentes dans une étude, et un arbitre leur a demandé de formaliser cela en SEM. Comme ce dont ils ont besoin ne semble pas …

24 references modeling sem psychometrics

3

Test post hoc après ANOVA avec mesures répétées en utilisant R

J'ai effectué une ANOVA de mesures répétées en R, comme suit: aov_velocity = aov(Velocity ~ Material + Error(Subject/(Material)), data=scrd) summary(aov_velocity) Quelle syntaxe en R peut être utilisée pour effectuer un test post hoc après une ANOVA avec des mesures répétées? Le test de Tukey avec correction de Bonferroni serait-il approprié? …

24 r anova repeated-measures post-hoc contrasts

2

Pouvez-vous expliquer l'estimation de la densité de la fenêtre de Parzen (noyau) en termes simples?

L'estimation de la densité de fenêtre de Parzen est décrite comme p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) où est le nombre d'éléments dans le vecteur, x est un vecteur, p ( x ) est une densité de probabilité de x , h est la dimension de la fenêtre …

24 pdf kernel-smoothing intuition density-estimation

3

Que sont les «coefficients aliasés»?

Lors de la construction d'un modèle de régression dans R ( lm), je reçois fréquemment ce message "there are aliased coefficients in the model" Qu'est-ce que ça veut dire exactement? En outre, à cause de cela, predict()donne également un avertissement. Bien que ce ne soit qu'un avertissement, je veux savoir …

24 r regression

3

Pourquoi la régression logistique est-elle un modèle linéaire?

Je veux savoir pourquoi la régression logistique est appelée un modèle linéaire. Il utilise une fonction sigmoïde, qui n'est pas linéaire. Alors pourquoi la régression logistique est-elle un modèle linéaire?

24 regression logistic terminology

1

Kolmogorov-Smirnov avec des données discrètes: Quelle est la bonne utilisation de dgof :: ks.test dans R?

Questions pour débutants: Je veux tester si deux ensembles de données discrets proviennent de la même distribution. Un test de Kolmogorov-Smirnov m'a été proposé. Conover ( Practical Nonparametric Statistics , 3d) semble dire que le test de Kolmogorov-Smirnov peut être utilisé à cette fin, mais son comportement est "conservateur" avec …

24 r goodness-of-fit discrete-data kolmogorov-smirnov

1

F1 / Dice-Score vs IoU

J'étais confus quant aux différences entre le score F1, le score Dice et IoU (intersection sur l'union). À ce jour, j'ai découvert que F1 et Dice signifient la même chose (non?) Et IoU a une formule très similaire aux deux autres. F1 / Dés:2 TP2 TP+ FP+ FN2TP2TP+FP+FN\frac{2TP}{2TP+FP+FN} IoU / …

24 terminology accuracy precision-recall

2

Pourquoi lambda «dans une erreur standard du minimum» est-il une valeur recommandée pour lambda dans une régression nette élastique?

Je comprends le rôle que joue lambda dans une régression élastique-nette. Et je peux comprendre pourquoi on sélectionnerait lambda.min, la valeur de lambda qui minimise l'erreur de validation croisée. Ma question est: où dans la littérature statistique est-il recommandé d'utiliser lambda.1se, quelle est la valeur de lambda qui minimise l'erreur …

24 regression cross-validation regularization glmnet elastic-net

2

Quelle est la différence entre abandon et drop connect?

Quelle est la différence entre abandon et drop connect? AFAIK, le décrochage supprime aléatoirement les nœuds cachés pendant la formation, mais les maintient dans les tests, et le drop connect supprime les connexions. Mais la suppression des connexions n'est-elle pas équivalente à la suppression des nœuds cachés? Les nœuds (ou …

24 neural-networks dropout

2

Comment initialiser les éléments de la matrice de filtre?

J'essaie de mieux comprendre les réseaux de neurones convolutifs en écrivant du code Python qui ne dépend pas des bibliothèques (comme Convnet ou TensorFlow), et je me retrouve coincé dans la littérature sur la façon de choisir des valeurs pour la matrice du noyau, quand effectuer une convolution sur une …

24 machine-learning neural-networks deep-learning feature-construction conv-neural-network