Science des données machine-learning

1

Différence de Keras entre val_loss et perte pendant l'entraînement

Quelle est la différence entre val_losset losspendant la formation à Keras? Par exemple Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 Sur certains sites, j'ai lu qu'à la validation, le décrochage ne fonctionnait pas.

18 machine-learning deep-learning keras

1

Pourquoi ReLU est meilleur que les autres fonctions d'activation

Ici, la réponse se réfère à des gradients de fuite et d'explosion qui ont été sigmoiddes fonctions d'activation similaires, mais, je suppose, Reluont un inconvénient et c'est sa valeur attendue. il n'y a pas de limitation pour la sortie du Reluet donc sa valeur attendue n'est pas nulle. Je me …

17 machine-learning neural-network deep-learning gradient-descent activation-function

2

Doc2Vec - Comment étiqueter les paragraphes (gensim)

Je me demande comment étiqueter (étiqueter) des phrases / paragraphes / documents avec doc2vec dans gensim - d'un point de vue pratique. Avez-vous besoin d'avoir chaque phrase / paragraphe / document avec sa propre étiquette unique (par exemple "Sent_123")? Cela semble utile si vous voulez dire "quels mots ou phrases …

17 machine-learning text-mining word-embeddings word2vec

3

Ensachage vs abandon dans les réseaux de neurones profonds

L'ensachage est la génération de plusieurs prédicteurs qui fonctionnent comme un prédicteur unique. Le décrochage est une technique qui enseigne à un réseau de neurones à faire la moyenne de tous les sous-réseaux possibles. En regardant les compétitions les plus importantes de Kaggle, il semble que ces deux techniques soient …

17 machine-learning neural-network deep-learning

3

Les voisins les plus proches recherchent des données dimensionnelles très élevées

J'ai une grande matrice clairsemée d'utilisateurs et d'articles qu'ils aiment (de l'ordre de 1 million d'utilisateurs et de 100 000 articles, avec un très faible niveau de rareté). J'explore les façons dont je pourrais effectuer une recherche sur kNN. Compte tenu de la taille de mon jeu de données et …

17 machine-learning distributed map-reduce dimensionality-reduction

2

Utilisez le liblinéaire sur le Big Data pour l'analyse sémantique

J'utilise Libsvm pour former des données et prédire la classification d'un problème d' analyse sémantique . Mais il a un problème de performance sur les données à grande échelle, car l'analyse sémantique concerne le problème à n dimensions . L'année dernière, Liblinear a été publié, et il peut résoudre le …

17 machine-learning bigdata libsvm

5

Détection visuelle des chats par détection d'anomalies

J'ai un projet de loisir auquel j'envisage de m'engager comme un moyen d'augmenter mon expérience jusqu'ici limitée de l'apprentissage automatique. J'ai suivi et complété le MOOC Coursera sur le sujet. Ma question concerne la faisabilité du projet. La tâche est la suivante: Les chats voisins visitent de temps en temps …

17 machine-learning

2

Pourquoi utiliser à la fois l'ensemble de validation et l'ensemble de test?

Considérons un réseau de neurones: Pour un ensemble de données donné, nous le divisons en ensemble de formation, de validation et de test. Supposons que nous le fassions dans le rapport classique 60:20:20, puis nous empêchons le surapprentissage en validant le réseau en le vérifiant sur l'ensemble de validation. Alors, …

17 machine-learning neural-network cross-validation

5

Fusionner des données rares et denses dans l'apprentissage automatique pour améliorer les performances

J'ai des caractéristiques clairsemées qui sont prédictives, j'ai aussi des caractéristiques denses qui sont également prédictives. J'ai besoin de combiner ces fonctionnalités pour améliorer les performances globales du classificateur. Maintenant, le problème est que lorsque j'essaie de les combiner, les entités denses ont tendance à dominer davantage les entités clairsemées, …

17 machine-learning classification predictive-modeling scikit-learn supervised-learning

2

Devrions-nous également appliquer la normalisation aux données de test?

Je fais un projet sur le problème d'identification des auteurs. J'avais appliqué la normalisation tf-idf pour former des données, puis formé un svm sur ces données. Maintenant, lorsque j'utilise le classificateur, dois-je également normaliser les données de test. Je pense que l'objectif de base de la normalisation est de faire …

17 machine-learning neural-network deep-learning

2

Où dans le flux de travail devons-nous traiter les données manquantes?

Je crée un flux de travail pour créer des modèles d'apprentissage automatique (dans mon cas, en utilisant Python pandaset des sklearnpackages) à partir de données extraites d'une très grande base de données (ici, Vertica via SQL et pyodbc), et une étape critique de ce processus consiste à imputer les données …

16 machine-learning python pandas scikit-learn

3

Qu'est-ce que le poids et les préjugés dans l'apprentissage en profondeur?

Je commence à apprendre l'apprentissage automatique sur le site Web de Tensorflow. J'ai développé une compréhension très très rudimentaire du déroulement d'un programme d'apprentissage en profondeur (cette méthode me permet d'apprendre rapidement au lieu de lire des livres et de gros articles). Il y a quelques choses déroutantes que j'ai …

16 machine-learning deep-learning tensorflow

1

Qu'est-ce qu'un score LB en apprentissage automatique?

Je parcourais un article sur les blogs kaggle. À plusieurs reprises, l'auteur mentionne le `` score LB '' et `` l'ajustement LB '') comme mesure de l'efficacité de l'apprentissage automatique (avec le score de validation croisée (CV)). Avec une recherche sur le sens de «LB» que j'ai passé pas mal …

16 machine-learning accuracy

2

Quels types de problèmes d'apprentissage conviennent aux machines à support vectoriel?

Quelles sont les caractéristiques ou les propriétés qui indiquent qu'un certain problème d'apprentissage peut être résolu à l'aide de machines à vecteurs de support? En d'autres termes, qu'est-ce qui, lorsque vous voyez un problème d'apprentissage, vous fait dire "oh je devrais certainement utiliser des SVM pour cela" plutôt que des …

16 machine-learning svm supervised-learning unsupervised-learning

2

Comment choisir les fonctionnalités d'un réseau neuronal?

Je sais qu'il n'y a pas de réponse claire à cette question, mais supposons que j'ai un énorme réseau de neurones, avec beaucoup de données et je veux ajouter une nouvelle fonctionnalité en entrée. La "meilleure" façon serait de tester le réseau avec la nouvelle fonctionnalité et de voir les …

16 machine-learning neural-network feature-selection feature-extraction

Questions marquées «machine-learning»