Statistiques et Big Data machine-learning

4

Rappel et précision dans la classification

J'ai lu des définitions de rappel et de précision, bien que ce soit chaque fois dans le contexte de la recherche d'informations. Je me demandais si quelqu'un pourrait expliquer cela un peu plus dans un contexte de classification et peut-être illustrer quelques exemples. Disons par exemple que j'ai un classificateur …

40 machine-learning metric

4

Comment la fonction d'activation rectiligne résout-elle le problème du gradient en voie de disparition dans les réseaux de neurones?

J'ai trouvé des unités linéaires rectifiées (ReLU) louées à plusieurs endroits comme solution au problème du gradient de fuite pour les réseaux de neurones. En d’autres termes, on utilise max (0, x) comme fonction d’activation. Lorsque l'activation est positive, il est évident qu'elle est meilleure que, par exemple, la fonction …

40 machine-learning neural-networks deep-learning gradient-descent

2

Mesures d'importance variable dans les forêts aléatoires

J'ai joué avec des forêts aléatoires pour la régression et j'ai du mal à comprendre exactement ce que signifient les deux mesures d'importance et comment elles doivent être interprétées. La importance()fonction donne deux valeurs pour chaque variable: %IncMSEet IncNodePurity. Existe-t-il des interprétations simples pour ces 2 valeurs? En IncNodePurityparticulier, s’agit-il …

40 r machine-learning random-forest importance

7

Normalisation des données et normalisation dans les réseaux de neurones

J'essaie de prédire le résultat d'un système complexe en utilisant des réseaux de neurones (ANN). Les résultats (dépendants) vont de 0 à 10 000. Les différentes variables d'entrée ont des plages différentes. Toutes les variables ont des distributions à peu près normales. Je considère différentes options pour mettre à l'échelle …

40 machine-learning neural-networks multidimensional-scaling

5

LDA vs word2vec

J'essaie de comprendre ce qu'est la similitude entre Latent Dirichlet Allocation et word2vec pour calculer la similarité de mots. Si je comprends bien, LDA mappe les mots sur un vecteur de probabilités de sujets latents , tandis que word2vec les mappe sur un vecteur de nombres réels (liés à la …

39 machine-learning self-study natural-language latent-variable word2vec

6

Pourquoi ai-je un arbre de décision à 100% de précision?

Je reçois une précision de 100% pour mon arbre de décision. Qu'est-ce que je fais mal? Ceci est mon code: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split …

38 machine-learning python cart accuracy

3

Guide de sélection des hyperparamètres dans Deep Learning

Je cherche un document qui pourrait aider à donner des directives sur la façon de choisir les hyperparamètres d’une architecture profonde, comme des encodeurs automatiques superposés ou des réseaux de valeurs profondes. Il y a beaucoup d'hyperparamètres et je suis très confus sur la façon de les choisir. De plus, …

38 machine-learning deep-learning deep-belief-networks hyperparameter

3

Apprentissage en ligne ou hors ligne?

Quelle est la différence entre l' apprentissage hors ligne et en ligne ? Est-ce juste une question d’apprentissage sur l’ensemble du jeu de données (hors ligne) par opposition à un apprentissage incrémentiel (une instance à la fois)? Quels sont les exemples d'algorithmes utilisés dans les deux?

38 machine-learning online

4

Qu'est-ce que l'invariance de la traduction dans la vision par ordinateur et le réseau de neurones convolutionnels?

Je n'ai pas de formation en vision par ordinateur. Pourtant, lorsque je lis des articles et des articles sur le traitement d'images et les réseaux de neurones convolutionnels, je suis constamment confronté au terme translation invariance, ou translation invariant. Ou j'ai lu beaucoup que l'opération de convolution fournit translation invariance? …

38 machine-learning conv-neural-network convolution computer-vision

3

Quelles sont les différences entre 'epoch', 'batch' et 'minibatch'?

Autant que je sache, lors de l'adoption de l'algorithme d'apprentissage de Stochastic Gradient Descent, quelqu'un utilise 'epoch' pour l'ensemble de données complet, et 'batch' pour les données utilisées dans une seule étape de mise à jour, tandis qu'une autre utilise respectivement 'batch' et 'minibatch', et les autres utilisent 'epoch' et …

38 machine-learning

3

Variance des estimations de validation croisée multipliées par sous la forme : quel est le rôle de la «stabilité»?

TL, DR: Il semble que, contrairement aux conseils répétés, la validation croisée "une fois (LOO-CV)" (laissez-passer une fois) - c’est-à-direun CVfois, avec(le nombre de plis) égal à(le d’observations d’entraînement) - fournit des estimations de l’erreur de généralisation qui sont la moindre variable pour tout, et non la plus variable, en …

37 regression machine-learning variance cross-validation predictive-models

6

Améliorer la classification avec de nombreuses variables catégorielles

Je travaille sur un ensemble de données comprenant plus de 200 000 échantillons et environ 50 caractéristiques par échantillon: 10 variables continues et les 40 autres valeurs sont des variables catégorielles (pays, langues, domaines scientifiques, etc.). Pour ces variables catégorielles, vous avez par exemple 150 pays différents, 50 langues, 50 …

37 machine-learning classification categorical-data random-forest many-categories

4

Une solide formation en mathématiques est-elle une condition préalable à la maîtrise du blanchiment?

Je commence à vouloir développer mes propres compétences et j'ai toujours été fasciné par l'apprentissage automatique. Cependant, il y a six ans, au lieu de poursuivre dans cette voie, j'ai décidé de passer à un autre niveau en informatique. Je développe des logiciels et des applications depuis environ 8 à …

37 machine-learning references mathematical-statistics

3

Application des méthodes d'apprentissage automatique aux sites Web StackExchange

J'ai un cours d' apprentissage machine ce semestre et le professeur nous a demandé de trouver un problème du monde réel et de le résoudre par l'une des méthodes d'apprentissage automatique introduites dans la classe, telles que: Arbres de décision Réseaux de neurones artificiels Machines à vecteurs de support Apprentissage …

37 machine-learning

2

Si seule la prévision présente un intérêt, pourquoi utiliser le lasso sur la crête?

À la page 223 de l' Introduction à l'apprentissage statistique , les auteurs résument les différences entre la régression de la crête et le lasso. Ils fournissent un exemple (Figure 6.9) du cas où "le lasso tend à surpasser la régression de la crête en termes de biais, de variance …

37 machine-learning prediction lasso regularization ridge-regression

Questions marquées «machine-learning»