Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Supposons que je courais une régression . Pourquoi en sélectionnant les premiers composants de , le modèle conserve-t-il son pouvoir prédictif sur ?k X YOui∼ XOui∼XY \sim XkkkXXXOuiOuiY Je comprends que du point de vue de la réduction de dimensionnalité / sélection des caractéristiques, si sont les vecteurs propres de …
Dans certaines conférences et tutoriels que j'ai vus, ils suggèrent de diviser vos données en trois parties: formation, validation et test. Mais il n'est pas clair comment le jeu de données de test doit être utilisé, ni comment cette approche est meilleure que la validation croisée sur l'ensemble des données. …
Le lmerTestpackage fournit une anova()fonction pour les modèles mixtes linéaires avec éventuellement l'approximation de Satterthwaite (par défaut) ou de Kenward-Roger des degrés de liberté (df). Quelle est la différence entre ces deux approches? Quand choisir lequel?
Les forêts aléatoires sont bien connues pour fonctionner assez bien sur une variété de tâches et ont été désignées comme l' homme du cuir des méthodes d'apprentissage . Y a-t-il des types de problèmes ou de conditions spécifiques dans lesquels il faut éviter d'utiliser une forêt aléatoire?
Supposons que j'ai un ensemble de données pour une tâche de classification statistique supervisée, par exemple via un classifieur Bayes. Cet ensemble de données se compose de 20 entités et je veux le résumer à 2 entités via des techniques de réduction de dimensionnalité telles que l'analyse en composantes principales …
J'ai plusieurs questions concernant la pénalité de crête dans le contexte des moindres carrés: βridge=(λID+X′X)−1X′yβridge=(λID+X′X)−1X′y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1) L'expression suggère que la matrice de covariance de X est rétrécie vers une matrice diagonale, ce qui signifie que (en supposant que les variables sont normalisées avant la procédure) …
Je suis un étudiant en master CS dans une université allemande en train de rédiger ma thèse. Je vais avoir fini dans deux mois, je dois prendre la décision très difficile si je dois continuer avec un doctorat ou trouver un emploi dans l'industrie. Mes raisons de faire un doctorat: …
Dans un modèle de régression simple, y=β0+β1x+ε,y=β0+β1x+ε, y = \beta_0 + \beta_1 x + \varepsilon, les estimateurs OLS et sont corrélés.ββ^OLS0β^0OLS\hat{\beta}_0^{OLS}β^OLS1β^1OLS\hat{\beta}_1^{OLS} La formule de la corrélation entre les deux estimateurs est (si je l'ai dérivée correctement): Corr(β^OLS0,β^OLS1)=−∑ni=1xin−−√∑ni=1x2i−−−−−−−√.Corr(β^0OLS,β^1OLS)=−∑i=1nxin∑i=1nxi2. \operatorname{Corr}(\hat{\beta}_0^{OLS},\hat{\beta}_1^{OLS}) = \frac{-\sum_{i=1}^{n}x_i}{\sqrt{n} \sqrt{\sum_{i=1}^{n}x_i^2} }. Des questions: Quelle est l'explication intuitive de la …
J'ai une confusion sur les estimateurs biaisés du maximum de vraisemblance (ML). Les mathématiques de l'ensemble du concept sont assez claires pour moi, mais je ne peux pas comprendre le raisonnement intuitif derrière. Étant donné un certain ensemble de données qui contient des échantillons d'une distribution, qui est elle-même fonction …
Considérez l'exemple R ci-dessous: plot( hclust(dist(USArrests), "ave") ) Que signifie exactement l'axe Y "Hauteur"? En regardant la Caroline du Nord et la Californie (plutôt à gauche). La Californie est-elle "plus proche" de la Caroline du Nord que l'Arizona? Puis-je faire cette interprétation? Hawaii (à droite) rejoint le cluster assez tard. …
J'ai exécuté une conception répétée selon laquelle j'ai testé 30 hommes et 30 femmes à travers trois tâches différentes. Je veux comprendre en quoi le comportement des hommes et des femmes est différent et comment cela dépend de la tâche. J'ai utilisé à la fois le package lmer et lme4 …
J'ai un data.frame avec 800 obs. de 40 variables, et j'aimerais utiliser l'analyse des composants principaux pour améliorer les résultats de ma prédiction (qui fonctionne jusqu'à présent le mieux avec Support Vector Machine sur une quinzaine de variables sélectionnées à la main). Je comprends qu'un prcomp peut m'aider à améliorer …
Je voudrais générer une matrice de corrélation aléatoire de telle sorte qu'il y ait des corrélations modérément fortes présentes: n × nCC\mathbf Cn×nn×nn \times n matrice symétrique réelle carrée de taille, avec par exemple ;n = 100n×nn×nn \times nn=100n=100n=100 positif-défini, c'est-à-dire avec toutes les valeurs propres réelles et positives; rang …
J'étudie différentes techniques utilisées dans le clustering de documents et je voudrais dissiper certains doutes concernant PCA (analyse en composantes principales) et LSA (analyse sémantique latente). Première chose - quelles sont les différences entre eux? Je sais qu'en PCA, la décomposition SVD est appliquée à la matrice terme-covariance, tandis qu'en …
J'essaie de mieux comprendre l'estimation de la densité du noyau. En utilisant la définition de Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fh^(x)=1n∑ni=1Kh(x−xi)=1nh∑ni=1K(x−xih)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big) Prenons pour être une fonction rectangulaire qui donne si est compris entre et et sinon, et (taille de fenêtre) pour …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.