Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

1
Pourquoi mes valeurs p diffèrent-elles entre la sortie de la régression logistique, le test du khi-carré et l'intervalle de confiance du OU?
J'ai construit une régression logistique dans laquelle la variable de résultat est en train de guérir après le traitement ( Curevs No Cure). Tous les patients de cette étude ont reçu un traitement. Je voudrais savoir si le diabète est associé à ce résultat. Dans R ma sortie de régression …

2
Quand le t-SNE est-il trompeur?
Citant l'un des auteurs: L'intégration de voisins stochastiques t-distribués (t-SNE) est une technique ( primée ) de réduction de dimensionnalité particulièrement bien adaptée à la visualisation de jeux de données de grande dimension. Cela semble donc très bien, mais c'est l'auteur qui parle. Une autre citation de l'auteur (concernant le …

3
Est-ce que le signe de scores ou de charges dans PCA ou FA a un sens? Puis-je inverser le signe?
J'ai effectué une analyse en composantes principales (ACP) avec R en utilisant deux fonctions différentes ( prcompet princomp) et j'ai observé que les scores de l'ACP différaient par leur signe. Comment cela peut-il être? Considère ceci: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] …
37 r  pca  factor-analysis 

4
Différence entre prévision et prédiction?
Je me demandais quelle différence et quel rapport existe entre prévision et prédiction? Surtout dans les séries chronologiques et la régression? Par exemple, ai-je raison de dire que: Dans les séries chronologiques, la prévision semble vouloir dire estimer une valeur future à partir des valeurs passées d’une série chronologique. En …



5
Analyse croisée des séries chronologiques
J'utilise le paquet caret dans R pour créer des modèles prédictifs de classification et de régression. Caret fournit une interface unifiée permettant de régler les hyper-paramètres de modèle par validation croisée ou initialisation. Par exemple, si vous construisez un modèle simple de classification 'voisins les plus proches', combien de voisins …







1
Inférence variationnelle versus MCMC: quand choisir l'un plutôt que l'autre?
Je pense que j'ai une idée générale de VI et de MCMC, y compris les différentes saveurs de MCMC telles que l’échantillonnage de Gibbs, Metropolis Hastings, etc. Ce document fournit un magnifique exposé des deux méthodes. J'ai les questions suivantes: Si je souhaite faire l'inférence bayésienne, pourquoi choisirais-je une méthode …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.