Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Dans les documents de classification d'ImageNet, les taux d'erreur parmi les premiers et les cinq premiers sont des unités importantes pour mesurer le succès de certaines solutions, mais quels sont ces taux d'erreur? Dans la classification ImageNet avec les réseaux de neurones à convolution profonde de Krizhevsky et al. chaque …
Je souhaite réduire la dimensionnalité des systèmes d'ordre supérieur et capturer l'essentiel de la covariance sur un champ de préférence à 2 dimensions ou à 1 dimension. Je comprends que cela peut être fait via l’analyse en composantes principales et j’ai utilisé PCA dans de nombreux scénarios. Cependant, je ne …
Je cherche un document qui pourrait aider à donner des directives sur la façon de choisir les hyperparamètres d’une architecture profonde, comme des encodeurs automatiques superposés ou des réseaux de valeurs profondes. Il y a beaucoup d'hyperparamètres et je suis très confus sur la façon de les choisir. De plus, …
J'ai récemment appliqué diverses méthodes de prévision (MEAN, RWF, ETS, ARIMA et MLP) et j'ai constaté que MEAN était étonnamment performant. (MEAN: où toutes les prédictions futures sont prédites égales à la moyenne arithmétique des valeurs observées.) MEAN a même surperformé ARIMA sur les trois séries que j'ai utilisées. Ce …
Comment fonctionne l' approximation du point de selle? A quel genre de problème s'agit-il? (N'hésitez pas à utiliser un exemple particulier ou des exemples à titre d'illustration) Y a-t-il des inconvénients, des difficultés, des points à surveiller ou des pièges pour les imprudents?
Quelle est la différence entre l' apprentissage hors ligne et en ligne ? Est-ce juste une question d’apprentissage sur l’ensemble du jeu de données (hors ligne) par opposition à un apprentissage incrémentiel (une instance à la fois)? Quels sont les exemples d'algorithmes utilisés dans les deux?
Je sais que cette question est assez spécifique R, mais je pense peut-être à la variance des proportions expliquée, , de manière incorrecte. Voici.R2R2R^2 J'essaie d'utiliser le Rpaquet randomForest. J'ai des données d'entraînement et des données de test. Lorsque j'adapte un modèle de forêt aléatoire, la randomForestfonction vous permet de …
Comment utiliser un mot incorporé pour mapper un document sur un vecteur de caractéristiques approprié pour une utilisation avec apprentissage supervisé? Un mot incorporant mappe chaque mot www à un vecteur v∈Rdv∈Rdv \in \mathbb{R}^d , où ddd est un nombre non trop grand (par exemple 500). Les mots les plus …
J'essaie de comprendre le raisonnement en choisissant une approche de test spécifique lorsqu'il s'agit d'un test A / B simple (c'est-à-dire deux variantes / groupes avec une réponse binaire (convertie ou non). À titre d'exemple, j'utiliserai les données ci-dessous. Version Visits Conversions A 2069 188 B 1826 220 La réponse …
Je n'ai pas de formation en vision par ordinateur. Pourtant, lorsque je lis des articles et des articles sur le traitement d'images et les réseaux de neurones convolutionnels, je suis constamment confronté au terme translation invariance, ou translation invariant. Ou j'ai lu beaucoup que l'opération de convolution fournit translation invariance? …
Autant que je sache, lors de l'adoption de l'algorithme d'apprentissage de Stochastic Gradient Descent, quelqu'un utilise 'epoch' pour l'ensemble de données complet, et 'batch' pour les données utilisées dans une seule étape de mise à jour, tandis qu'une autre utilise respectivement 'batch' et 'minibatch', et les autres utilisent 'epoch' et …
Biplot est souvent utilisé pour afficher les résultats de l' analyse en composantes principales (et des techniques associées). Il s’agit d’un diagramme de dispersion double ou superposé montrant les charges et les scores des composants simultanément. Aujourd'hui, @amoeba m'a informé qu'il avait donné une réponse partant de mon commentaire pour …
Cette question a déjà une réponse ici: Qu'est-ce qu'une graine dans un générateur de nombres aléatoires? 3 réponses Je me rends compte que l’on utilise set.seed()en R pour la génération de nombres pseudo-aléatoires. Je me rends également compte qu’utiliser le même numéro, comme pour set.seed(123)vous assurer de pouvoir reproduire les …
Je suis assez nouveau sur ce point avec les tests de données binomiales, mais je devais en faire un et maintenant je ne sais pas comment interpréter le résultat. La variable y, la variable de réponse, est binomiale et les facteurs explicatifs sont continus. Voici ce que j'ai obtenu en …
Dans la régression linéaire simple, nous avons , où . J'ai dérivé l'estimateur: où et sont les exemples de moyennes de et .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , x¯x¯\bar{x}y¯y¯\bar{y}xxxyyy Maintenant, je …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.