Statistiques et Big Data

1

Existe-t-il une analyse factorielle ou une ACP pour les données ordinales ou binaires?

J'ai terminé l'analyse en composantes principales (PCA), l'analyse factorielle exploratoire (EFA) et l'analyse factorielle confirmatoire (CFA), en traitant les données avec une échelle de likert (réponses à 5 niveaux: aucune, un peu, certaines, ..) en continu variable. Ensuite, en utilisant Lavaan, j'ai répété le CFA définissant les variables comme catégoriques. …

28 pca factor-analysis ordinal-data binary-data likert

3

Casse-tête: Quelle est la longueur attendue d'une séquence iid qui augmente de façon monotone lorsqu'elle est tirée d'une distribution uniforme [0,1]?

Il s'agit d'une question d'entrevue pour un poste d'analyste quantitatif, rapportée ici . Supposons que nous dessinons à partir d'une distribution uniforme et que les tirages soient iid, quelle est la longueur attendue d'une distribution augmentant de façon monotone? C'est-à-dire que nous arrêtons de dessiner si le tirage actuel est …

28 probability random-variable expected-value uniform iid

3

Pourquoi un mélange de deux variables normalement distribuées n'est-il bimodal que si leurs moyennes diffèrent d'au moins deux fois l'écart type commun?

Sous mélange de deux distributions normales: https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions "Un mélange de deux distributions normales a cinq paramètres à estimer: les deux moyennes, les deux variances et le paramètre de mélange. Un mélange de deux distributions normales avec des écarts-types égaux n'est bimodal que si leurs moyennes diffèrent d'au moins deux fois …

28 bimodal

1

Dans quelle mesure un modèle de régression est-il incorrect lorsque les hypothèses ne sont pas remplies?

Lors de l'ajustement d'un modèle de régression, que se passe-t-il si les hypothèses des résultats ne sont pas remplies, en particulier: Que se passe-t-il si les résidus ne sont pas homoscédastiques? Si les résidus montrent une tendance à la hausse ou à la baisse dans les résidus par rapport au …

28 regression multiple-regression error assumptions normality-assumption

2

Signification (et preuve) de «RNN peut approximer n'importe quel algorithme»

Récemment, j'ai lu qu'un réseau neuronal récurrent peut se rapprocher de n'importe quel algorithme. Donc ma question est: qu'est-ce que cela signifie exactement et pouvez-vous me donner une référence où cela est prouvé?

28 references rnn

1

Pourquoi ma dérivation d'une solution de lasso de forme fermée est-elle incorrecte?

Le problème du lasso a la solution de forme fermée: \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS }} | - \ alpha) ^ + si X a des colonnes orthonormées. Cela a …

28 regression lasso regularization

1

Valeur de «fréquence» pour les données d'intervalle de secondes / minutes en R

J'utilise R (3.1.1) et les modèles ARIMA pour les prévisions. Je voudrais savoir quel devrait être le paramètre "fréquence", qui est affecté dans la ts()fonction , si je utilise des données de séries chronologiques qui sont: séparés par des minutes et s'étalent sur 180 jours (1440 minutes / jour) séparés …

28 r time-series arima multiple-seasonalities mape

2

Bruit blanc dans les statistiques

Je vois souvent le terme bruit blanc apparaître lors de la lecture de différents modèles statistiques. Je dois cependant admettre que je ne suis pas tout à fait sûr de ce que cela signifie. Il est généralement abrégé en WN( 0 , σ2)WN(0,σ2)WN(0,σ^2) . Cela signifie-t-il qu'il est normalement distribué …

28 normal-distribution white-noise

1

Approximation de la fonction de perte XGBoost avec expansion de Taylor

À titre d'exemple, prendre la fonction objective du modèle XGBoost sur le « e itération:ttt L(t)=∑i=1nℓ(yi,y^(t−1)i+ft(xi))+Ω(ft)L(t)=∑i=1nℓ(yi,y^i(t−1)+ft(xi))+Ω(ft)\mathcal{L}^{(t)}=\sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)}+f_t(\mathbf{x}_i))+\Omega(f_t) où est la fonction de perte, est le ième sortie arbre et est la régularisation. L'une des (nombreuses) étapes clés pour un calcul rapide est l'approximation:ℓℓ\ellftftf_ttttΩΩ\Omega L(t)≈∑i=1nℓ(yi,y^(t−1)i)+gtft(xi)+12hif2t(xi)+Ω(ft),L(t)≈∑i=1nℓ(yi,y^i(t−1))+gtft(xi)+12hift2(xi)+Ω(ft),\mathcal{L}^{(t)}\approx \sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)})+g_tf_t(\mathbf{x}_i)+\frac{1}{2}h_if_t^2(\mathbf{x}_i)+\Omega(f_t), où et sont les première et …

28 optimization loss-functions boosting xgboost taylor-series

4

Une distribution uniforme de nombreuses valeurs de p donne-t-elle des preuves statistiques que H0 est vrai?

Un seul test statistique peut prouver que l'hypothèse nulle (H0) est fausse et donc l'hypothèse alternative (H1) est vraie. Mais il ne peut pas être utilisé pour montrer que H0 est vrai car le fait de ne pas rejeter H0 ne signifie pas que H0 est vrai. Mais supposons que …

28 hypothesis-testing p-value combining-p-values

2

Pourquoi les valeurs de p sont-elles trompeuses après avoir effectué une sélection pas à pas?

Prenons par exemple un modèle de régression linéaire. J'ai entendu dire que, dans l'exploration de données, après avoir effectué une sélection par étapes basée sur le critère AIC, il est trompeur de regarder les valeurs de p pour tester l'hypothèse nulle selon laquelle chaque véritable coefficient de régression est nul. …

28 multiple-regression predictive-models data-mining stepwise-regression

2

Réseaux de croyances profondes ou machines Deep Boltzmann?

Je suis confus. Y a-t-il une différence entre les réseaux de croyances profondes et les machines Deep Boltzmann? Si oui, quelle est la différence?

28 machine-learning deep-learning rbm deep-belief-networks

2

Quels aspects de l'ensemble de données «Iris» le rendent si efficace en tant qu'ensemble de données d'exemple / d'enseignement / de test

Le jeu de données "Iris" est probablement familier à la plupart des gens ici - c'est l'un des jeux de données de test canoniques et un jeu de données d'exemple pour tout, de la visualisation des données à l'apprentissage automatique. Par exemple, tout le monde dans cette question a fini …

28 dataset

7

Concept statistique pour expliquer pourquoi vous êtes moins susceptible de retourner le même nombre de têtes que de queues, à mesure que le nombre de retournements augmente?

Je travaille sur l'apprentissage des probabilités et des statistiques en lisant quelques livres et en écrivant du code, et en simulant des lancers de pièces, j'ai remarqué quelque chose qui m'a semblé légèrement contraire à l'intuition naïve. Si vous lancez une pièce juste fois, le rapport des têtes aux queues …

28 probability computational-statistics

2

Pourquoi la régression de la crête glmnet me donne-t-elle une réponse différente du calcul manuel?

J'utilise glmnet pour calculer les estimations de régression de crête. J'ai obtenu des résultats qui m'ont rendu suspect dans la mesure où glmnet fait vraiment ce que je pense qu'il fait. Pour vérifier cela, j'ai écrit un script R simple où je compare le résultat de la régression de crête …

28 r ridge-regression glmnet