Statistiques et Big Data normal-distribution

8

Y a-t-il une distribution en forme de plateau?

Je recherche une distribution où la densité de probabilité diminue rapidement après un certain point loin de la moyenne, ou selon mes propres mots une "distribution en forme de plateau". Quelque chose entre le gaussien et l'uniforme.

30 distributions normal-distribution uniform

2

Pourquoi devrions-nous utiliser des erreurs t au lieu d'erreurs normales?

Dans ce billet de blog d'Andrew Gelman, il y a le passage suivant: Les modèles bayésiens d'il y a 50 ans semblent désespérément simples (sauf, bien sûr, pour des problèmes simples), et je m'attends à ce que les modèles bayésiens d'aujourd'hui semblent désespérément simples, dans 50 ans. (Juste pour un …

30 distributions bayesian normal-distribution model robust

5

Génération manuelle de nombres aléatoires

Comment puis-je générer manuellement un nombre aléatoire à partir d'une distribution donnée, comme par exemple, 10 réalisations à partir de la distribution normale standard?

30 normal-distribution simulation monte-carlo random-generation randomness

5

Comment gérer les données hiérarchiques / imbriquées dans l'apprentissage automatique

Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

5

Y a-t-il une explication pour expliquer pourquoi tant de phénomènes naturels suivent une distribution normale?

Je pense que c'est un sujet fascinant et je ne le comprends pas pleinement. Quelle loi de la physique fait que tant de phénomènes naturels ont une distribution normale? Il semblerait plus intuitif qu'ils auraient une distribution uniforme. Il est si difficile pour moi de comprendre cela et je sens …

29 distributions normal-distribution normality-assumption uniform

3

En quoi la distribution de Poisson est-elle différente de la distribution normale?

Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 7 ans . J'ai généré un vecteur qui a une distribution de Poisson, comme suit: x = rpois(1000,10) Si je fais un histogramme en utilisant hist(x), …

29 distributions histogram normal-distribution poisson-distribution

3

R: Random Forest lançant NaN / Inf dans l'erreur «appel de fonction étrangère» malgré l'absence de NaN dans l'ensemble de données [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . J'utilise caret pour exécuter une forêt aléatoire validée de façon croisée …

29 r random-forest caret regression prediction fitting social-science poisson-distribution distributions characteristic-function bayesian prior regression normal-distribution interaction nonparametric skewness svm standard-deviation standard-error regression-coefficients igraph natural-language word2vec word-embeddings regression machine-learning sampling r regression machine-learning random-forest ensemble sampling unbiased-estimator proof estimators mse probability conditional-probability bayes anova missing-data neural-networks recommender-system r confidence-interval sample multiple-imputation r time-series forecasting mase

2

Bruit blanc dans les statistiques

Je vois souvent le terme bruit blanc apparaître lors de la lecture de différents modèles statistiques. Je dois cependant admettre que je ne suis pas tout à fait sûr de ce que cela signifie. Il est généralement abrégé en WN( 0 , σ2)WN(0,σ2)WN(0,σ^2) . Cela signifie-t-il qu'il est normalement distribué …

28 normal-distribution white-noise

3

Distribution du rapport gaussien: les dérivés sous-jacents aux et aux s

Je travaille avec deux distributions normales indépendantes et , avec des moyennes et et des variances et .Y μ x μ y σ 2 x σ 2 yXXXOuiYYμXμx\mu_xμyμy\mu_yσ2Xσx2\sigma^2_xσ2yσy2\sigma^2_y Je suis intéressé par la distribution de leur rapport . Ni ni n'ont une moyenne de zéro, donc n'est pas distribué comme …

28 distributions normal-distribution references mathematical-statistics cdf

5

Exemples concrets de distributions courantes

Je suis un étudiant diplômé développant un intérêt pour les statistiques. J'aime le matériel dans l'ensemble, mais j'ai parfois du mal à penser aux applications dans la vie réelle. Plus précisément, ma question porte sur les distributions statistiques couramment utilisées (normales - bêta-gamma, etc.). Je suppose que dans certains cas, …

28 normal-distribution references gamma-distribution beta-distribution application

2

Pourquoi l'erreur quadratique moyenne est-elle l'entropie croisée entre la distribution empirique et un modèle gaussien?

Dans 5.5, Deep Learning (par Ian Goodfellow, Yoshua Bengio et Aaron Courville), il déclare que Toute perte constituée d'une log-vraisemblance négative est une entropie croisée entre la distribution empirique définie par l'ensemble d'apprentissage et la distribution de probabilité définie par le modèle. Par exemple, l'erreur quadratique moyenne est l'entropie croisée …

28 machine-learning normal-distribution cross-entropy

1

Les degrés de liberté peuvent-ils être un nombre non entier?

Lorsque j'utilise GAM, cela me donne un DF résiduel de (dernière ligne du code). Qu'est-ce que ça veut dire? Au-delà de l'exemple GAM, en général, le nombre de degrés de liberté peut-il être un nombre non entier?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) …

27 r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

1

Distance de l'engin de terre (EMD) entre deux Gaussiens

Existe-t-il une formule sous forme fermée pour (ou une sorte de liaison sur) l'EMD entre x1∼N(μ1,Σ1)x1∼N(μ1,Σ1)x_1\sim N(\mu_1, \Sigma_1) et x2∼N(μ2,Σ2)x2∼N(μ2,Σ2)x_2 \sim N(\mu_2, \Sigma_2) ?

26 normal-distribution distance

5

Comment la régression linéaire utilise-t-elle la distribution normale?

Dans la régression linéaire, chaque valeur prédite est supposée avoir été choisie dans une distribution normale de valeurs possibles. Voir ci-dessous. Mais pourquoi chaque valeur prédite est-elle supposée provenir d'une distribution normale? Comment la régression linéaire utilise-t-elle cette hypothèse? Que faire si les valeurs possibles ne sont pas normalement distribuées?

26 regression probability distributions normal-distribution modeling

3

Comment calculer l'intervalle de confiance du rapport de deux moyennes normales

Je veux dériver les limites de l' intervalle de confiance de pour le rapport de deux moyennes. Supposons que X 1 ∼ N ( θ 1 , σ 2 ) et X 2 ∼ N ( θ 2 , σ 2 ) étant indépendants, le rapport moyen Γ = θ …

26 normal-distribution mean

Questions marquées «normal-distribution»