Questions marquées «machine-learning»

Les algorithmes d'apprentissage automatique construisent un modèle des données d'apprentissage. Le terme «apprentissage automatique» est vaguement défini; il comprend ce qu'on appelle aussi l'apprentissage statistique, l'apprentissage par renforcement, l'apprentissage non supervisé, etc. TOUJOURS AJOUTER UN ÉTIQUETTE PLUS SPÉCIFIQUE.

4
Rappel et précision dans la classification
J'ai lu des définitions de rappel et de précision, bien que ce soit chaque fois dans le contexte de la recherche d'informations. Je me demandais si quelqu'un pourrait expliquer cela un peu plus dans un contexte de classification et peut-être illustrer quelques exemples. Disons par exemple que j'ai un classificateur …

4
Comment la fonction d'activation rectiligne résout-elle le problème du gradient en voie de disparition dans les réseaux de neurones?
J'ai trouvé des unités linéaires rectifiées (ReLU) louées à plusieurs endroits comme solution au problème du gradient de fuite pour les réseaux de neurones. En d’autres termes, on utilise max (0, x) comme fonction d’activation. Lorsque l'activation est positive, il est évident qu'elle est meilleure que, par exemple, la fonction …

2
Mesures d'importance variable dans les forêts aléatoires
J'ai joué avec des forêts aléatoires pour la régression et j'ai du mal à comprendre exactement ce que signifient les deux mesures d'importance et comment elles doivent être interprétées. La importance()fonction donne deux valeurs pour chaque variable: %IncMSEet IncNodePurity. Existe-t-il des interprétations simples pour ces 2 valeurs? En IncNodePurityparticulier, s’agit-il …


5
LDA vs word2vec
J'essaie de comprendre ce qu'est la similitude entre Latent Dirichlet Allocation et word2vec pour calculer la similarité de mots. Si je comprends bien, LDA mappe les mots sur un vecteur de probabilités de sujets latents , tandis que word2vec les mappe sur un vecteur de nombres réels (liés à la …

6
Pourquoi ai-je un arbre de décision à 100% de précision?
Je reçois une précision de 100% pour mon arbre de décision. Qu'est-ce que je fais mal? Ceci est mon code: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split …


3
Apprentissage en ligne ou hors ligne?
Quelle est la différence entre l' apprentissage hors ligne et en ligne ? Est-ce juste une question d’apprentissage sur l’ensemble du jeu de données (hors ligne) par opposition à un apprentissage incrémentiel (une instance à la fois)? Quels sont les exemples d'algorithmes utilisés dans les deux?

4
Qu'est-ce que l'invariance de la traduction dans la vision par ordinateur et le réseau de neurones convolutionnels?
Je n'ai pas de formation en vision par ordinateur. Pourtant, lorsque je lis des articles et des articles sur le traitement d'images et les réseaux de neurones convolutionnels, je suis constamment confronté au terme translation invariance, ou translation invariant. Ou j'ai lu beaucoup que l'opération de convolution fournit translation invariance? …

3
Quelles sont les différences entre 'epoch', 'batch' et 'minibatch'?
Autant que je sache, lors de l'adoption de l'algorithme d'apprentissage de Stochastic Gradient Descent, quelqu'un utilise 'epoch' pour l'ensemble de données complet, et 'batch' pour les données utilisées dans une seule étape de mise à jour, tandis qu'une autre utilise respectivement 'batch' et 'minibatch', et les autres utilisent 'epoch' et …

3
Variance des estimations de validation croisée multipliées par sous la forme : quel est le rôle de la «stabilité»?
TL, DR: Il semble que, contrairement aux conseils répétés, la validation croisée "une fois (LOO-CV)" (laissez-passer une fois) - c’est-à-direun CVfois, avec(le nombre de plis) égal à(le d’observations d’entraînement) - fournit des estimations de l’erreur de généralisation qui sont la moindre variable pour tout, et non la plus variable, en …

6
Améliorer la classification avec de nombreuses variables catégorielles
Je travaille sur un ensemble de données comprenant plus de 200 000 échantillons et environ 50 caractéristiques par échantillon: 10 variables continues et les 40 autres valeurs sont des variables catégorielles (pays, langues, domaines scientifiques, etc.). Pour ces variables catégorielles, vous avez par exemple 150 pays différents, 50 langues, 50 …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.