Statistiques et Big Data

7

Graphique pour la relation entre deux variables ordinales

Qu'est-ce qu'un graphique approprié pour illustrer la relation entre deux variables ordinales? Quelques options auxquelles je peux penser: Nuage de points avec ajout de jitter aléatoire pour empêcher les points de se cacher. Apparemment, un graphique standard - Minitab appelle cela un "tracé de valeurs individuelles". À mon avis, cela …

46 data-visualization categorical-data ordinal-data scatterplot

8

Pièges dans l'analyse des séries chronologiques

Je commence tout juste à apprendre par moi-même dans l'analyse des séries chronologiques. J'ai remarqué qu'il existe un certain nombre de pièges qui ne sont pas applicables aux statistiques générales. Alors, construisant sur Quels sont les péchés statistiques communs? , J'aimerais demander: Quels sont les pièges courants ou les péchés …

46 time-series self-study

3

Quelle est l'intuition derrière les distributions gaussiennes conditionnelles?

Supposons que X∼N2(μ,Σ)X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma}) . Alors la distribution conditionnelle de X1X1X_1 étant donné que X2=x2X2=x2X_2 = x_2 est multivariée, normalement distribuée, avec la moyenne: E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) et de variance: Var[P(X1|X2=x2)]=σ11−σ212σ22Var[P(X1|X2=x2)]=σ11−σ122σ22{\rm Var}[P(X_1 | X_2 = x_2)] = \sigma_{11}-\frac{\sigma_{12}^{2}}{\sigma_{22}} Il est logique que la …

46 normal-distribution multivariate-analysis intuition

2

L'intuition derrière le paradoxe de Stein ne s'applique que dans les dimensions

L'exemple de Stein montre que l'estimation du maximum de vraisemblance de variables normalement distribuées avec les moyennes et les variances est inadmissible (sous une fonction de perte au carré) si et si . Pour une preuve plus nette, voir le premier chapitre de Inférence à grande échelle: méthodes empiriques bayésiennes …

46 maximum-likelihood unbiased-estimator intuition steins-phenomenon

6

Pourcentage de régions qui se chevauchent de deux distributions normales

Je me demandais, étant donné deux distributions normales avec et σ 2 , μ 2σ1, μ 1σ1, μ1\sigma_1,\ \mu_1σ2, μ 2σ2, μ2\sigma_2, \ \mu_2 Comment puis-je calculer le pourcentage de régions qui se chevauchent de deux distributions? Je suppose que ce problème a un nom spécifique, connaissez-vous un nom particulier …

46 normal-distribution similarities metric bhattacharyya

5

Comment calculer le pseudo-

L' écriture de Christopher Manning sur la régression logistique dans R montre une régression logistique dans R comme suit: ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) Quelques sorties: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family = binomial("logit")) Deviance Residuals: Min 1Q …

46 r logistic log-likelihood

5

Comprendre les régressions - le rôle du modèle

Comment utiliser un modèle de régression si vous ne connaissez pas la fonction pour laquelle vous essayez d'obtenir les paramètres? J'ai vu une recherche qui disait que les mères qui allaitaient leurs enfants étaient moins susceptibles de souffrir de diabète plus tard dans la vie. La recherche a été réalisée …

46 regression modeling epidemiology log-linear

4

Qu'est-ce qu'une matrice de contraste?

Qu'est- ce que la matrice de contraste (terme utilisé dans une analyse avec prédicteurs catégoriels) et comment spécifie-t-on exactement la matrice de contraste? Par exemple, quelles sont les colonnes, quelles sont les lignes, quelles sont les contraintes sur cette matrice et que signifie le nombre dans la colonne jet la …

46 regression categorical-data definition contrasts categorical-encoding

1

Comprendre que «presque tous les minimums locaux ont une valeur de fonction très similaire à l’optimum global»

Dans un récent post de blog de Rong Ge, il était dit que: On pense que pour de nombreux problèmes, dont l’apprentissage de réseaux profonds, presque tous les minimums locaux ont une valeur fonctionnelle très proche de l’optimum global, et qu’il est donc suffisant de trouver un minimum local. D'où …

46 machine-learning neural-networks optimization deep-learning

1

KL divergence entre deux gaussiennes multivariées

Je ne parviens pas à calculer la formule de divergence KL en supposant deux distributions normales multivariées. J'ai résolu le cas univarié assez facilement. Cependant, cela fait un bon moment que je n'ai pas pris les statistiques mathématiques, alors j'ai du mal à les étendre au cas multivarié. Je suis …

46 normal-distribution kullback-leibler proof

6

Quelle est la différence entre estimation et prédiction?

Par exemple, j'ai des données historiques sur les pertes et je calcule des quantiles extrêmes (perte potentielle ou valeur maximale probable). Les résultats obtenus servent à estimer la perte ou à la prédire? Où peut-on tracer la ligne? Je suis confus.

46 estimation predictor prediction-interval

7

Outils d'analyse de survie en Python [fermé]

Je me demande s’il existe des packages pour Python capables d’effectuer une analyse de survie. J'utilisais le paquet de survie dans R mais j'aimerais porter mon travail en python.

46 survival python

6

Explication intuitive du compromis biais-variance?

Je cherche une explication intuitive du compromis biais-variance, à la fois en général et spécifiquement dans le contexte de la régression linéaire.

46 regression variance bias

4

Normalisation vs mise à l'échelle

Quelle est la différence entre les données "Normalisation" et les données "Mise à l'échelle"? Jusqu'à présent, je pensais que les deux termes faisaient référence au même processus, mais je réalise maintenant qu'il y a quelque chose de plus que je ne sais pas / ne comprends pas. De même, s'il …

46 data-transformation scales normality-assumption normalization

3

Interprétation du prédicteur et / ou de la réponse transformé par log

Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme l'augmentation en pourcentage, mais comment cela change-t-il …

46 regression data-transformation interpretation regression-coefficients logarithm r dataset stata hypothesis-testing contingency-tables hypothesis-testing statistical-significance standard-deviation unbiased-estimator t-distribution r functional-data-analysis maximum-likelihood bootstrap regression change-point regression sas hypothesis-testing bayesian randomness predictive-models nonparametric terminology parametric correlation effect-size loess mean pdf quantile-function bioinformatics regression terminology r-squared pdf maximum multivariate-analysis references data-visualization r pca r mixed-model lme4-nlme distributions probability bayesian prior anova chi-squared binomial generalized-linear-model anova repeated-measures t-test post-hoc clustering variance probability hypothesis-testing references binomial profile-likelihood self-study excel data-transformation skewness distributions statistical-significance econometrics spatial r regression anova spss linear-model