Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'ai été impressionné par les résultats du document ICML 2014 " Représentations distribuées des peines et des documents " de Le et Mikolov. La technique qu'ils décrivent, appelée «vecteurs de paragraphe», apprend des représentations non supervisées de paragraphes / documents arbitrairement longs, basées sur une extension du modèle word2vec. L'article …
Je comprends que la différence entre eux est liée au fait que la variable de regroupement dans le modèle est estimée comme un effet fixe ou aléatoire, mais je ne comprends pas pourquoi elles ne sont pas les mêmes (si elles ne sont pas les mêmes). Je suis particulièrement intéressé …
Vous trouverez ci-dessous des graphiques en acf et pacf d'une série de données mensuelles. Le deuxième tracé est acf avec ci.type = 'ma': La persistance de valeurs élevées dans la parcelle acf représente probablement une tendance positive à long terme. La question est de savoir si cela représente une variation …
Je sais comment calculer mathématiquement PCA et SVD, et je sais que les deux peuvent être appliqués à la régression linéaire des moindres carrés. Le principal avantage de SVD semble mathématiquement être qu'il peut être appliqué à des matrices non carrées. Les deux se concentrent sur la décomposition de la …
Je souhaite mieux comprendre la méthode delta pour l'approximation des erreurs-types des effets marginaux moyens d'un modèle de régression qui inclut un terme d'interaction. J'ai examiné des questions connexes sous la méthode delta, mais aucune n'a fourni exactement ce que je cherchais. Considérez les données d'exemple suivantes comme un exemple …
Je sais que le réglage de l'hyperparamètre en dehors de la validation croisée peut conduire à des estimations biaisées de la validité externe, car l'ensemble de données que vous utilisez pour mesurer les performances est le même que celui que vous avez utilisé pour régler les fonctionnalités. Ce que je …
Selon ma compréhension, dans l'ACP basée sur les corrélations, nous obtenons des charges de facteur (= composant principal dans ce cas) qui ne sont que les corrélations entre les variables et les facteurs. Maintenant, lorsque je dois générer des scores factoriels dans SPSS, je peux obtenir directement les scores factoriels …
Si est un vecteur aléatoire et est une matrice fixe, quelqu'un pourrait-il expliquer pourquoiZZ\mathbf {Z}UNEUNEAc o v [A Z ]=A c o v [ Z ] A⊤.cov[UNEZ]=UNEcov[Z]UNE⊤.\mathrm{cov}[A \mathbf {Z}]= A \mathrm{cov}[\mathbf {Z}]A^\top.
Soit un modèle de régression linéaire obtenu par la fonction R lm voudrait savoir s'il est possible de l'obtenir par la commande Mean Squared Error. J'ai eu la sortie SUIVANTE d'un exemple > lm <- lm(MuscleMAss~Age,data) > sm<-summary(lm) > sm Call: lm(formula = MuscleMAss ~ Age, data = data) Residuals: …
Dans R, quand j'ai un (généralisé) modèle linéaire ( lm, glm, gls, glmm, ...), comment tester le coefficient (pente de régression) contre toute autre valeur que 0? Dans le résumé du modèle, les résultats du test t du coefficient sont automatiquement rapportés, mais uniquement pour comparaison avec 0. Je veux …
Je viens de faire quelques lectures sur l'échantillonnage de Gibbs et l'algorithme de Metropolis Hastings et j'ai quelques questions. Si je comprends bien, dans le cas de l'échantillonnage de Gibbs, si nous avons un problème multivarié important, nous échantillonnons à partir de la distribution conditionnelle, c'est-à-dire échantillonnons une variable tout …
J'ai un ensemble de données composé de 5 fonctionnalités: A, B, C, D, E. Ce sont toutes des valeurs numériques. Au lieu de faire un clustering basé sur la densité, ce que je veux faire, c'est grouper les données d'une manière d'arbre de décision. L'approche que je veux dire est …
Avec toutes les discussions et le battage médiatique sur l'apprentissage profond ces jours-ci, j'ai lu des trucs élémentaires à ce sujet. Je viens de découvrir que ce n'est qu'une autre méthode d'apprentissage automatique pour apprendre des modèles à partir de données. Mais ma question est: d'où vient et pourquoi cette …
La régression pénalisée L1 (alias lasso) est présentée en deux formulations. Soit les deux fonctions objectives Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1.Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1. Q_1 = \frac{1}{2}||Y - X\beta||_2^2 \\ Q_2 =\frac{1}{2}||Y - X\beta||_2^2 + \lambda ||\beta||_1. Alors les deux formulations différentes sont argminβQ1argminβQ1 \text{argmin}_\beta \; Q_1 sous réserve de ||β||1≤t,||β||1≤t, ||\beta||_1 \leq t, et, de façon …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.