Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Après avoir formé les vecteurs de mots avec word2vec, vaut-il mieux les normaliser avant de les utiliser pour certaines applications en aval? C'est-à-dire quels sont les avantages / inconvénients de les normaliser?
C’est une question qui découle d’une situation réelle, à propos de laquelle je suis vraiment perplexe quant à sa réponse. Mon fils doit commencer l'école primaire à Londres. Comme nous sommes italiens, j'étais curieuse de savoir combien d'enfants italiens fréquentaient déjà l'école. J'ai posé la question à l'agent d'admission lors …
TL, DR: Il semble que, contrairement aux conseils répétés, la validation croisée "une fois (LOO-CV)" (laissez-passer une fois) - c’est-à-direun CVfois, avec(le nombre de plis) égal à(le d’observations d’entraînement) - fournit des estimations de l’erreur de généralisation qui sont la moindre variable pour tout, et non la plus variable, en …
Dériver numériquement les MLE de GLMM est difficile et, dans la pratique, je sais que nous ne devrions pas utiliser l'optimisation de la force brute (par exemple, en utilisant optimune méthode simple). Mais pour mon propre but éducatif, je veux l'essayer pour m'assurer de bien comprendre le modèle (voir le …
Je suis un étudiant en économie avec une certaine expérience de l'économétrie et de R. J'aimerais savoir s'il existe une situation où nous devrions inclure une variable dans une régression alors qu'elle n'est pas statistiquement significative.
Quelqu'un peut-il me donner s'il vous plaît une certaine intuition quant au moment de choisir SVM ou LR? Je veux comprendre l'intuition de la différence entre les critères d'optimisation d'apprentissage de l'hyperplan des deux, dont les objectifs respectifs sont les suivants: SVM: essayez de maximiser la marge entre les vecteurs …
J'ai trois groupes de données, chacun avec une distribution binomiale (c'est-à-dire que chaque groupe a des éléments qui réussissent ou échouent). Je n'ai pas de probabilité de réussite prévue, mais je ne peux me fier qu'au taux de réussite de chacun comme approximation du taux de réussite réel. J'ai seulement …
Je veux obtenir un intervalle de prédiction autour d'une prédiction à partir d'un modèle lmer (). J'ai trouvé des discussions à ce sujet: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq mais ils semblent ne pas tenir compte de l'incertitude des effets aléatoires. Voici un exemple spécifique. Je cours des poissons d'or. J'ai des données sur …
Je travaille sur un ensemble de données comprenant plus de 200 000 échantillons et environ 50 caractéristiques par échantillon: 10 variables continues et les 40 autres valeurs sont des variables catégorielles (pays, langues, domaines scientifiques, etc.). Pour ces variables catégorielles, vous avez par exemple 150 pays différents, 50 langues, 50 …
Je prépare mon mariage. Je souhaite estimer combien de personnes viendront à mon mariage. J'ai créé une liste de personnes et la possibilité qu'elles assistent en pourcentage. Par exemple Dad 100% Mom 100% Bob 50% Marc 10% Jacob 25% Joseph 30% J'ai une liste d'environ 230 personnes avec des pourcentages. …
Voici une citation du livre Bishop's "Pattern Recognition and Machine Learning", section 12.2.4 "Analyse factorielle": Selon la partie mis en évidence, l' analyse factorielle capture la covariance entre les variables dans la matriceWWW . Je me demande comment ? Voici comment je le comprends. Supposons que soit la variable dimensionnelle …
Je commence à vouloir développer mes propres compétences et j'ai toujours été fasciné par l'apprentissage automatique. Cependant, il y a six ans, au lieu de poursuivre dans cette voie, j'ai décidé de passer à un autre niveau en informatique. Je développe des logiciels et des applications depuis environ 8 à …
Pour le tracé 1, je peux tester l'association entre x et y en effectuant une simple corrélation. Pour le tracé 2, où la relation est non linéaire mais où il existe une relation claire entre x et y, comment puis-je tester l'association et nommer sa nature?
Mon jeu de données est petit (120 échantillons), mais le nombre d’entités est important varie de (1000 à 200 000). Bien que je sois en train de sélectionner des fonctionnalités pour choisir un sous-ensemble de fonctionnalités, cela peut tout de même être excessif. Ma première question est la suivante: comment …
Je veux supposer que la température de surface de la mer Baltique est la même année après année, puis la décrire avec un modèle fonction / linéaire. L'idée que j'avais était de simplement entrer l'année sous forme de nombre décimal (ou num_months / 12) et de déterminer la température à …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.