Statistiques et Big Data

2

ImageNet: quel est le taux d’erreur top-1 et top-5?

Dans les documents de classification d'ImageNet, les taux d'erreur parmi les premiers et les cinq premiers sont des unités importantes pour mesurer le succès de certaines solutions, mais quels sont ces taux d'erreur? Dans la classification ImageNet avec les réseaux de neurones à convolution profonde de Krizhevsky et al. chaque …

38 classification neural-networks error measurement-error image-processing

3

PCA fonctionnerait-il pour les types de données booléens (binaires)?

Je souhaite réduire la dimensionnalité des systèmes d'ordre supérieur et capturer l'essentiel de la covariance sur un champ de préférence à 2 dimensions ou à 1 dimension. Je comprends que cela peut être fait via l’analyse en composantes principales et j’ai utilisé PCA dans de nombreux scénarios. Cependant, je ne …

38 pca data-visualization binary-data dimensionality-reduction correspondence-analysis

3

Guide de sélection des hyperparamètres dans Deep Learning

Je cherche un document qui pourrait aider à donner des directives sur la façon de choisir les hyperparamètres d’une architecture profonde, comme des encodeurs automatiques superposés ou des réseaux de valeurs profondes. Il y a beaucoup d'hyperparamètres et je suis très confus sur la façon de les choisir. De plus, …

38 machine-learning deep-learning deep-belief-networks hyperparameter

2

Est-il inhabituel que MEAN surpasse ARIMA?

J'ai récemment appliqué diverses méthodes de prévision (MEAN, RWF, ETS, ARIMA et MLP) et j'ai constaté que MEAN était étonnamment performant. (MEAN: où toutes les prédictions futures sont prédites égales à la moyenne arithmétique des valeurs observées.) MEAN a même surperformé ARIMA sur les trois séries que j'ai utilisées. Ce …

38 forecasting arima

3

Comment fonctionne l'approximation du point de selle?

Comment fonctionne l' approximation du point de selle? A quel genre de problème s'agit-il? (N'hésitez pas à utiliser un exemple particulier ou des exemples à titre d'illustration) Y a-t-il des inconvénients, des difficultés, des points à surveiller ou des pièges pour les imprudents?

38 distributions mathematical-statistics mgf saddlepoint-approximation partial-moments

3

Apprentissage en ligne ou hors ligne?

Quelle est la différence entre l' apprentissage hors ligne et en ligne ? Est-ce juste une question d’apprentissage sur l’ensemble du jeu de données (hors ligne) par opposition à un apprentissage incrémentiel (une instance à la fois)? Quels sont les exemples d'algorithmes utilisés dans les deux?

38 machine-learning online

1

calculé manuellement ne correspond pas à randomForest () pour tester de nouvelles données

Je sais que cette question est assez spécifique R, mais je pense peut-être à la variance des proportions expliquée, , de manière incorrecte. Voici.R2R2R^2 J'essaie d'utiliser le Rpaquet randomForest. J'ai des données d'entraînement et des données de test. Lorsque j'adapte un modèle de forêt aléatoire, la randomForestfonction vous permet de …

38 r correlation predictive-models random-forest r-squared

3

Appliquer des mots incorporés à l'ensemble du document pour obtenir un vecteur de caractéristiques

Comment utiliser un mot incorporé pour mapper un document sur un vecteur de caractéristiques approprié pour une utilisation avec apprentissage supervisé? Un mot incorporant mappe chaque mot www à un vecteur v∈Rdv∈Rdv \in \mathbb{R}^d , où ddd est un nombre non trop grand (par exemple 500). Les mots les plus …

38 classification natural-language supervised-learning word2vec word-embeddings

2

Tests A / B: test z vs test t vs test khi carré vs test exact de Fisher

J'essaie de comprendre le raisonnement en choisissant une approche de test spécifique lorsqu'il s'agit d'un test A / B simple (c'est-à-dire deux variantes / groupes avec une réponse binaire (convertie ou non). À titre d'exemple, j'utiliserai les données ci-dessous. Version Visits Conversions A 2069 188 B 1826 220 La réponse …

38 statistical-significance chi-squared p-value fishers-exact z-statistic

4

Qu'est-ce que l'invariance de la traduction dans la vision par ordinateur et le réseau de neurones convolutionnels?

Je n'ai pas de formation en vision par ordinateur. Pourtant, lorsque je lis des articles et des articles sur le traitement d'images et les réseaux de neurones convolutionnels, je suis constamment confronté au terme translation invariance, ou translation invariant. Ou j'ai lu beaucoup que l'opération de convolution fournit translation invariance? …

38 machine-learning conv-neural-network convolution computer-vision

3

Quelles sont les différences entre 'epoch', 'batch' et 'minibatch'?

Autant que je sache, lors de l'adoption de l'algorithme d'apprentissage de Stochastic Gradient Descent, quelqu'un utilise 'epoch' pour l'ensemble de données complet, et 'batch' pour les données utilisées dans une seule étape de mise à jour, tandis qu'une autre utilise respectivement 'batch' et 'minibatch', et les autres utilisent 'epoch' et …

38 machine-learning

1

PCA et analyse de la correspondance dans leur relation avec Biplot

Biplot est souvent utilisé pour afficher les résultats de l' analyse en composantes principales (et des techniques associées). Il s’agit d’un diagramme de dispersion double ou superposé montrant les charges et les scores des composants simultanément. Aujourd'hui, @amoeba m'a informé qu'il avait donné une réponse partant de mon commentaire pour …

38 pca multivariate-analysis svd correspondence-analysis biplot

3

Nombre aléatoire-Set.seed (N) in R [dupliquer]

Cette question a déjà une réponse ici: Qu'est-ce qu'une graine dans un générateur de nombres aléatoires? 3 réponses Je me rends compte que l’on utilise set.seed()en R pour la génération de nombres pseudo-aléatoires. Je me rends également compte qu’utiliser le même numéro, comme pour set.seed(123)vous assurer de pouvoir reproduire les …

38 r random-generation

2

Interprétation de la sortie de R pour la régression binomiale

Je suis assez nouveau sur ce point avec les tests de données binomiales, mais je devais en faire un et maintenant je ne sais pas comment interpréter le résultat. La variable y, la variable de réponse, est binomiale et les facteurs explicatifs sont continus. Voici ce que j'ai obtenu en …

38 r regression logistic binomial interpretation

3

Calculer la variance du coefficient de régression dans la régression linéaire simple

Dans la régression linéaire simple, nous avons , où . J'ai dérivé l'estimateur: où et sont les exemples de moyennes de et .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , x¯x¯\bar{x}y¯y¯\bar{y}xxxyyy Maintenant, je …

38 regression mathematical-statistics variance linear-model regression-coefficients