Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

1
Les performances de pointe rapportées de l'utilisation de vecteurs de paragraphe pour l'analyse des sentiments ont-elles été reproduites?
J'ai été impressionné par les résultats du document ICML 2014 " Représentations distribuées des peines et des documents " de Le et Mikolov. La technique qu'ils décrivent, appelée «vecteurs de paragraphe», apprend des représentations non supervisées de paragraphes / documents arbitrairement longs, basées sur une extension du modèle word2vec. L'article …

1
Pourquoi les valeurs estimées d'un meilleur prédicteur linéaire sans biais (BLUP) diffèrent-elles d'un meilleur estimateur linéaire sans biais (BLUE)?
Je comprends que la différence entre eux est liée au fait que la variable de regroupement dans le modèle est estimée comme un effet fixe ou aléatoire, mais je ne comprends pas pourquoi elles ne sont pas les mêmes (si elles ne sont pas les mêmes). Je suis particulièrement intéressé …

2
Comment interpréter ces parcelles ACF et PACF
Vous trouverez ci-dessous des graphiques en acf et pacf d'une série de données mensuelles. Le deuxième tracé est acf avec ci.type = 'ma': La persistance de valeurs élevées dans la parcelle acf représente probablement une tendance positive à long terme. La question est de savoir si cela représente une variation …

2
Y a-t-il un avantage de SVD sur PCA?
Je sais comment calculer mathématiquement PCA et SVD, et je sais que les deux peuvent être appliqués à la régression linéaire des moindres carrés. Le principal avantage de SVD semble mathématiquement être qu'il peut être appliqué à des matrices non carrées. Les deux se concentrent sur la décomposition de la …
20 pca  least-squares  svd 

1
Comment utiliser la méthode delta pour les erreurs standard des effets marginaux?
Je souhaite mieux comprendre la méthode delta pour l'approximation des erreurs-types des effets marginaux moyens d'un modèle de régression qui inclut un terme d'interaction. J'ai examiné des questions connexes sous la méthode delta, mais aucune n'a fourni exactement ce que je cherchais. Considérez les données d'exemple suivantes comme un exemple …


6
La médiane est-elle un type de moyenne, pour une généralisation de la «moyenne»?
Le concept de «moyenne» se déplace beaucoup plus loin que la moyenne arithmétique traditionnelle; s'étend-elle jusqu'à inclure la médiane? Par analogie, données brutes ⟶iddonnées brutes ⟶signifiermoyenne brute ⟶id- 1moyenne arithmétiquedonnées brutes ⟶recetteréciproques ⟶signifiersignifie réciproque ⟶recette- 1moyenne harmoniquedonnées brutes ⟶Journaljournaux ⟶signifierlog moyen ⟶Journal- 1Moyenne géométriquedonnées brutes ⟶carrécarrés ⟶signifiercarré moyen ⟶carré- 1racine …
20 mean  average  median 

2
Méthodes de calcul des scores factoriels et quelle est la matrice du «coefficient de score» en ACP ou en analyse factorielle?
Selon ma compréhension, dans l'ACP basée sur les corrélations, nous obtenons des charges de facteur (= composant principal dans ce cas) qui ne sont que les corrélations entre les variables et les facteurs. Maintenant, lorsque je dois générer des scores factoriels dans SPSS, je peux obtenir directement les scores factoriels …







2
KKT versus formulation non contrainte de régression au lasso
La régression pénalisée L1 (alias lasso) est présentée en deux formulations. Soit les deux fonctions objectives Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1.Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1. Q_1 = \frac{1}{2}||Y - X\beta||_2^2 \\ Q_2 =\frac{1}{2}||Y - X\beta||_2^2 + \lambda ||\beta||_1. Alors les deux formulations différentes sont argminβQ1argminβQ1 \text{argmin}_\beta \; Q_1 sous réserve de ||β||1≤t,||β||1≤t, ||\beta||_1 \leq t, et, de façon …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.