Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'ai terminé l'analyse en composantes principales (PCA), l'analyse factorielle exploratoire (EFA) et l'analyse factorielle confirmatoire (CFA), en traitant les données avec une échelle de likert (réponses à 5 niveaux: aucune, un peu, certaines, ..) en continu variable. Ensuite, en utilisant Lavaan, j'ai répété le CFA définissant les variables comme catégoriques. …
Il s'agit d'une question d'entrevue pour un poste d'analyste quantitatif, rapportée ici . Supposons que nous dessinons à partir d'une distribution uniforme et que les tirages soient iid, quelle est la longueur attendue d'une distribution augmentant de façon monotone? C'est-à-dire que nous arrêtons de dessiner si le tirage actuel est …
Sous mélange de deux distributions normales: https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions "Un mélange de deux distributions normales a cinq paramètres à estimer: les deux moyennes, les deux variances et le paramètre de mélange. Un mélange de deux distributions normales avec des écarts-types égaux n'est bimodal que si leurs moyennes diffèrent d'au moins deux fois …
Lors de l'ajustement d'un modèle de régression, que se passe-t-il si les hypothèses des résultats ne sont pas remplies, en particulier: Que se passe-t-il si les résidus ne sont pas homoscédastiques? Si les résidus montrent une tendance à la hausse ou à la baisse dans les résidus par rapport au …
Récemment, j'ai lu qu'un réseau neuronal récurrent peut se rapprocher de n'importe quel algorithme. Donc ma question est: qu'est-ce que cela signifie exactement et pouvez-vous me donner une référence où cela est prouvé?
Le problème du lasso a la solution de forme fermée: \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS }} | - \ alpha) ^ + si X a des colonnes orthonormées. Cela a …
J'utilise R (3.1.1) et les modèles ARIMA pour les prévisions. Je voudrais savoir quel devrait être le paramètre "fréquence", qui est affecté dans la ts()fonction , si je utilise des données de séries chronologiques qui sont: séparés par des minutes et s'étalent sur 180 jours (1440 minutes / jour) séparés …
Je vois souvent le terme bruit blanc apparaître lors de la lecture de différents modèles statistiques. Je dois cependant admettre que je ne suis pas tout à fait sûr de ce que cela signifie. Il est généralement abrégé en WN( 0 , σ2)WN(0,σ2)WN(0,σ^2) . Cela signifie-t-il qu'il est normalement distribué …
À titre d'exemple, prendre la fonction objective du modèle XGBoost sur le « e itération:ttt L(t)=∑i=1nℓ(yi,y^(t−1)i+ft(xi))+Ω(ft)L(t)=∑i=1nℓ(yi,y^i(t−1)+ft(xi))+Ω(ft)\mathcal{L}^{(t)}=\sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)}+f_t(\mathbf{x}_i))+\Omega(f_t) où est la fonction de perte, est le ième sortie arbre et est la régularisation. L'une des (nombreuses) étapes clés pour un calcul rapide est l'approximation:ℓℓ\ellftftf_ttttΩΩ\Omega L(t)≈∑i=1nℓ(yi,y^(t−1)i)+gtft(xi)+12hif2t(xi)+Ω(ft),L(t)≈∑i=1nℓ(yi,y^i(t−1))+gtft(xi)+12hift2(xi)+Ω(ft),\mathcal{L}^{(t)}\approx \sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)})+g_tf_t(\mathbf{x}_i)+\frac{1}{2}h_if_t^2(\mathbf{x}_i)+\Omega(f_t), où et sont les première et …
Un seul test statistique peut prouver que l'hypothèse nulle (H0) est fausse et donc l'hypothèse alternative (H1) est vraie. Mais il ne peut pas être utilisé pour montrer que H0 est vrai car le fait de ne pas rejeter H0 ne signifie pas que H0 est vrai. Mais supposons que …
Prenons par exemple un modèle de régression linéaire. J'ai entendu dire que, dans l'exploration de données, après avoir effectué une sélection par étapes basée sur le critère AIC, il est trompeur de regarder les valeurs de p pour tester l'hypothèse nulle selon laquelle chaque véritable coefficient de régression est nul. …
Le jeu de données "Iris" est probablement familier à la plupart des gens ici - c'est l'un des jeux de données de test canoniques et un jeu de données d'exemple pour tout, de la visualisation des données à l'apprentissage automatique. Par exemple, tout le monde dans cette question a fini …
Je travaille sur l'apprentissage des probabilités et des statistiques en lisant quelques livres et en écrivant du code, et en simulant des lancers de pièces, j'ai remarqué quelque chose qui m'a semblé légèrement contraire à l'intuition naïve. Si vous lancez une pièce juste fois, le rapport des têtes aux queues …
J'utilise glmnet pour calculer les estimations de régression de crête. J'ai obtenu des résultats qui m'ont rendu suspect dans la mesure où glmnet fait vraiment ce que je pense qu'il fait. Pour vérifier cela, j'ai écrit un script R simple où je compare le résultat de la régression de crête …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.