Statistiques et Big Data

1

Pourquoi mes valeurs p diffèrent-elles entre la sortie de la régression logistique, le test du khi-carré et l'intervalle de confiance du OU?

J'ai construit une régression logistique dans laquelle la variable de résultat est en train de guérir après le traitement ( Curevs No Cure). Tous les patients de cette étude ont reçu un traitement. Je voudrais savoir si le diabète est associé à ce résultat. Dans R ma sortie de régression …

37 r hypothesis-testing logistic generalized-linear-model odds-ratio

2

Quand le t-SNE est-il trompeur?

Citant l'un des auteurs: L'intégration de voisins stochastiques t-distribués (t-SNE) est une technique ( primée ) de réduction de dimensionnalité particulièrement bien adaptée à la visualisation de jeux de données de grande dimension. Cela semble donc très bien, mais c'est l'auteur qui parle. Une autre citation de l'auteur (concernant le …

37 data-visualization dimensionality-reduction tsne

3

Est-ce que le signe de scores ou de charges dans PCA ou FA a un sens? Puis-je inverser le signe?

J'ai effectué une analyse en composantes principales (ACP) avec R en utilisant deux fonctions différentes ( prcompet princomp) et j'ai observé que les scores de l'ACP différaient par leur signe. Comment cela peut-il être? Considère ceci: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] …

37 r pca factor-analysis

4

Différence entre prévision et prédiction?

Je me demandais quelle différence et quel rapport existe entre prévision et prédiction? Surtout dans les séries chronologiques et la régression? Par exemple, ai-je raison de dire que: Dans les séries chronologiques, la prévision semble vouloir dire estimer une valeur future à partir des valeurs passées d’une série chronologique. En …

37 regression time-series forecasting terminology

3

Tests d'hypothèses Bootstrap vs permutation

Il existe plusieurs techniques de ré - échantillonnage populaires, qui sont souvent utilisés dans la pratique, comme bootstrapping, test de permutation, jackknife, etc. Il existe de nombreux articles et livres traitent de ces techniques, par exemple Philippe I Bon (2010) Permutation, Parametric et Tests Bootstrap des hypothèses Ma question est …

37 hypothesis-testing nonparametric bootstrap permutation-test

2

Comprendre les paramètres de la distribution binomiale négative

J'essayais d'adapter mes données à différents modèles et j'ai compris que la fitdistrfonction de la bibliothèque MASSde Rme donnait Negative Binomialle meilleur ajustement. Maintenant, à partir de la page wiki , la définition est donnée comme suit: La distribution de NegBin (r, p) décrit la probabilité de k échecs et …

37 r distributions modeling negative-binomial

5

Analyse croisée des séries chronologiques

J'utilise le paquet caret dans R pour créer des modèles prédictifs de classification et de régression. Caret fournit une interface unifiée permettant de régler les hyper-paramètres de modèle par validation croisée ou initialisation. Par exemple, si vous construisez un modèle simple de classification 'voisins les plus proches', combien de voisins …

37 r time-series cross-validation

2

Si seule la prévision présente un intérêt, pourquoi utiliser le lasso sur la crête?

À la page 223 de l' Introduction à l'apprentissage statistique , les auteurs résument les différences entre la régression de la crête et le lasso. Ils fournissent un exemple (Figure 6.9) du cas où "le lasso tend à surpasser la régression de la crête en termes de biais, de variance …

37 machine-learning prediction lasso regularization ridge-regression

4

Différence entre «noyau» et «filtre» dans CNN

Quelle est la différence entre les termes "noyau" et "filtre" dans le contexte des réseaux de neurones à convolution?

37 neural-networks terminology deep-learning conv-neural-network

4

Que dois-je faire lorsque mon réseau de neurones ne se généralise pas bien?

J'entraîne un réseau de neurones et la perte d'apprentissage diminue, mais la perte de validation ne diminue pas, ou elle diminue beaucoup moins que ce à quoi je m'attendais, selon des références ou des expériences avec des architectures et des données très similaires. Comment puis-je réparer cela? Comme question Que …

37 neural-networks deep-learning

8

Quelle est la différence entre la prédiction et l'inférence?

Je suis en train de lire " Une introduction à l'apprentissage statistique ". Dans le chapitre 2, ils discutent de la raison d'estimer une fonctionFFf. 2.1.1 Pourquoi une estimation FFf? Il existe deux raisons principales pour lesquelles nous pouvons souhaiter estimer f : prédiction et inférence . Nous discutons chacun …

37 prediction terminology causality

1

Pourquoi le test de Mantel est-il préféré à celui de Moran?

Le test de Mantel est largement utilisé dans les études biologiques pour examiner la corrélation entre la distribution spatiale des animaux (position dans l'espace) et, par exemple, leur relation génétique, leur taux d'agression ou un autre attribut. Beaucoup de bons journaux l'utilisent ( PNAS, comportement animal, écologie moléculaire ...). etc.). …

37 r correlation spatial pattern-recognition

1

Quelles sont les mesures de qualité d'ajustement faciles à interpréter pour les modèles linéaires à effets mixtes?

J'utilise actuellement le package R lme4 . J'utilise des modèles à effets mixtes linéaires à effets aléatoires: library(lme4) mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + # random effects …

37 r regression mixed-model random-effects-model

1

Inférence variationnelle versus MCMC: quand choisir l'un plutôt que l'autre?

Je pense que j'ai une idée générale de VI et de MCMC, y compris les différentes saveurs de MCMC telles que l’échantillonnage de Gibbs, Metropolis Hastings, etc. Ce document fournit un magnifique exposé des deux méthodes. J'ai les questions suivantes: Si je souhaite faire l'inférence bayésienne, pourquoi choisirais-je une méthode …

37 machine-learning bayesian mcmc variational-bayes approximate-inference

5

Comment gérer un modèle de prédiction «autodestructeur»?

Je regardais une présentation d'un spécialiste du blanchiment d'argent chez un grand détaillant, où ils avaient développé un modèle permettant de prévoir les événements de rupture de stock. Supposons un instant que, avec le temps, leur modèle devienne très précis, ne serait-il pas en quelque sorte "autodestructeur"? Autrement dit, si …

36 machine-learning predictive-models