Quelle est la différence entre val_losset losspendant la formation à Keras? Par exemple Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 Sur certains sites, j'ai lu qu'à la validation, le décrochage ne fonctionnait pas.
Ici, la réponse se réfère à des gradients de fuite et d'explosion qui ont été sigmoiddes fonctions d'activation similaires, mais, je suppose, Reluont un inconvénient et c'est sa valeur attendue. il n'y a pas de limitation pour la sortie du Reluet donc sa valeur attendue n'est pas nulle. Je me …
Je me demande comment étiqueter (étiqueter) des phrases / paragraphes / documents avec doc2vec dans gensim - d'un point de vue pratique. Avez-vous besoin d'avoir chaque phrase / paragraphe / document avec sa propre étiquette unique (par exemple "Sent_123")? Cela semble utile si vous voulez dire "quels mots ou phrases …
L'ensachage est la génération de plusieurs prédicteurs qui fonctionnent comme un prédicteur unique. Le décrochage est une technique qui enseigne à un réseau de neurones à faire la moyenne de tous les sous-réseaux possibles. En regardant les compétitions les plus importantes de Kaggle, il semble que ces deux techniques soient …
J'ai une grande matrice clairsemée d'utilisateurs et d'articles qu'ils aiment (de l'ordre de 1 million d'utilisateurs et de 100 000 articles, avec un très faible niveau de rareté). J'explore les façons dont je pourrais effectuer une recherche sur kNN. Compte tenu de la taille de mon jeu de données et …
J'utilise Libsvm pour former des données et prédire la classification d'un problème d' analyse sémantique . Mais il a un problème de performance sur les données à grande échelle, car l'analyse sémantique concerne le problème à n dimensions . L'année dernière, Liblinear a été publié, et il peut résoudre le …
J'ai un projet de loisir auquel j'envisage de m'engager comme un moyen d'augmenter mon expérience jusqu'ici limitée de l'apprentissage automatique. J'ai suivi et complété le MOOC Coursera sur le sujet. Ma question concerne la faisabilité du projet. La tâche est la suivante: Les chats voisins visitent de temps en temps …
Considérons un réseau de neurones: Pour un ensemble de données donné, nous le divisons en ensemble de formation, de validation et de test. Supposons que nous le fassions dans le rapport classique 60:20:20, puis nous empêchons le surapprentissage en validant le réseau en le vérifiant sur l'ensemble de validation. Alors, …
J'ai des caractéristiques clairsemées qui sont prédictives, j'ai aussi des caractéristiques denses qui sont également prédictives. J'ai besoin de combiner ces fonctionnalités pour améliorer les performances globales du classificateur. Maintenant, le problème est que lorsque j'essaie de les combiner, les entités denses ont tendance à dominer davantage les entités clairsemées, …
Je fais un projet sur le problème d'identification des auteurs. J'avais appliqué la normalisation tf-idf pour former des données, puis formé un svm sur ces données. Maintenant, lorsque j'utilise le classificateur, dois-je également normaliser les données de test. Je pense que l'objectif de base de la normalisation est de faire …
Je crée un flux de travail pour créer des modèles d'apprentissage automatique (dans mon cas, en utilisant Python pandaset des sklearnpackages) à partir de données extraites d'une très grande base de données (ici, Vertica via SQL et pyodbc), et une étape critique de ce processus consiste à imputer les données …
Je commence à apprendre l'apprentissage automatique sur le site Web de Tensorflow. J'ai développé une compréhension très très rudimentaire du déroulement d'un programme d'apprentissage en profondeur (cette méthode me permet d'apprendre rapidement au lieu de lire des livres et de gros articles). Il y a quelques choses déroutantes que j'ai …
Je parcourais un article sur les blogs kaggle. À plusieurs reprises, l'auteur mentionne le `` score LB '' et `` l'ajustement LB '') comme mesure de l'efficacité de l'apprentissage automatique (avec le score de validation croisée (CV)). Avec une recherche sur le sens de «LB» que j'ai passé pas mal …
Quelles sont les caractéristiques ou les propriétés qui indiquent qu'un certain problème d'apprentissage peut être résolu à l'aide de machines à vecteurs de support? En d'autres termes, qu'est-ce qui, lorsque vous voyez un problème d'apprentissage, vous fait dire "oh je devrais certainement utiliser des SVM pour cela" plutôt que des …
Je sais qu'il n'y a pas de réponse claire à cette question, mais supposons que j'ai un énorme réseau de neurones, avec beaucoup de données et je veux ajouter une nouvelle fonctionnalité en entrée. La "meilleure" façon serait de tester le réseau avec la nouvelle fonctionnalité et de voir les …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.