Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Qu'est-ce qu'un graphique approprié pour illustrer la relation entre deux variables ordinales? Quelques options auxquelles je peux penser: Nuage de points avec ajout de jitter aléatoire pour empêcher les points de se cacher. Apparemment, un graphique standard - Minitab appelle cela un "tracé de valeurs individuelles". À mon avis, cela …
Je commence tout juste à apprendre par moi-même dans l'analyse des séries chronologiques. J'ai remarqué qu'il existe un certain nombre de pièges qui ne sont pas applicables aux statistiques générales. Alors, construisant sur Quels sont les péchés statistiques communs? , J'aimerais demander: Quels sont les pièges courants ou les péchés …
Supposons que X∼N2(μ,Σ)X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma}) . Alors la distribution conditionnelle de X1X1X_1 étant donné que X2=x2X2=x2X_2 = x_2 est multivariée, normalement distribuée, avec la moyenne: E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) et de variance: Var[P(X1|X2=x2)]=σ11−σ212σ22Var[P(X1|X2=x2)]=σ11−σ122σ22{\rm Var}[P(X_1 | X_2 = x_2)] = \sigma_{11}-\frac{\sigma_{12}^{2}}{\sigma_{22}} Il est logique que la …
L'exemple de Stein montre que l'estimation du maximum de vraisemblance de variables normalement distribuées avec les moyennes et les variances est inadmissible (sous une fonction de perte au carré) si et si . Pour une preuve plus nette, voir le premier chapitre de Inférence à grande échelle: méthodes empiriques bayésiennes …
Je me demandais, étant donné deux distributions normales avec et σ 2 , μ 2σ1, μ 1σ1, μ1\sigma_1,\ \mu_1σ2, μ 2σ2, μ2\sigma_2, \ \mu_2 Comment puis-je calculer le pourcentage de régions qui se chevauchent de deux distributions? Je suppose que ce problème a un nom spécifique, connaissez-vous un nom particulier …
L' écriture de Christopher Manning sur la régression logistique dans R montre une régression logistique dans R comme suit: ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) Quelques sorties: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family = binomial("logit")) Deviance Residuals: Min 1Q …
Comment utiliser un modèle de régression si vous ne connaissez pas la fonction pour laquelle vous essayez d'obtenir les paramètres? J'ai vu une recherche qui disait que les mères qui allaitaient leurs enfants étaient moins susceptibles de souffrir de diabète plus tard dans la vie. La recherche a été réalisée …
Qu'est- ce que la matrice de contraste (terme utilisé dans une analyse avec prédicteurs catégoriels) et comment spécifie-t-on exactement la matrice de contraste? Par exemple, quelles sont les colonnes, quelles sont les lignes, quelles sont les contraintes sur cette matrice et que signifie le nombre dans la colonne jet la …
Dans un récent post de blog de Rong Ge, il était dit que: On pense que pour de nombreux problèmes, dont l’apprentissage de réseaux profonds, presque tous les minimums locaux ont une valeur fonctionnelle très proche de l’optimum global, et qu’il est donc suffisant de trouver un minimum local. D'où …
Je ne parviens pas à calculer la formule de divergence KL en supposant deux distributions normales multivariées. J'ai résolu le cas univarié assez facilement. Cependant, cela fait un bon moment que je n'ai pas pris les statistiques mathématiques, alors j'ai du mal à les étendre au cas multivarié. Je suis …
Par exemple, j'ai des données historiques sur les pertes et je calcule des quantiles extrêmes (perte potentielle ou valeur maximale probable). Les résultats obtenus servent à estimer la perte ou à la prédire? Où peut-on tracer la ligne? Je suis confus.
Je me demande s’il existe des packages pour Python capables d’effectuer une analyse de survie. J'utilisais le paquet de survie dans R mais j'aimerais porter mon travail en python.
Quelle est la différence entre les données "Normalisation" et les données "Mise à l'échelle"? Jusqu'à présent, je pensais que les deux termes faisaient référence au même processus, mais je réalise maintenant qu'il y a quelque chose de plus que je ne sais pas / ne comprends pas. De même, s'il …
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme l'augmentation en pourcentage, mais comment cela change-t-il …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.