Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées


1
Comment fonctionne le paramètre validation_split de la fonction d'ajustement de Keras?
La validation-division dans la fonction d'ajustement du modèle Keras Sequential est documentée comme suit sur https://keras.io/models/sequential/ : validation_split: Flotter entre 0 et 1. Fraction des données d'apprentissage à utiliser comme données de validation. Le modèle séparera cette fraction des données d'entraînement, ne s'entraînera pas dessus et évaluera la perte et …


4
Des «règles de base» sur le nombre de fonctionnalités par rapport au nombre d'instances? (petits ensembles de données)
Je me demande s'il existe des heuristiques sur le nombre de caractéristiques par rapport au nombre d'observations. Évidemment, si un certain nombre de caractéristiques est égal au nombre d'observations, le modèle se surajustera. En utilisant des méthodes clairsemées (LASSO, filet élastique), nous pouvons supprimer plusieurs fonctionnalités pour réduire le modèle. …

3
Comment calculer l'impact de la mémoire mini-batch lors de la formation de modèles d'apprentissage en profondeur?
J'essaie de calculer la quantité de mémoire nécessaire à un GPU pour entraîner mon modèle sur la base de ces notes d'Andrej Karphaty: http://cs231n.github.io/convolutional-networks/#computational-considerations Mon réseau a 532 752 activations et 19 072 984 paramètres (poids et biais). Ce sont toutes des valeurs flottantes de 32 bits, donc chacune prend …


1
Deep Neural Network - Backpropogation avec ReLU
J'ai du mal à dériver la propagation avec ReLU, et j'ai fait du travail, mais je ne sais pas si je suis sur la bonne voie. Fonction de coût: où est la valeur réelle et est une valeur prédite. Supposons également que > 0 toujours.y y x12(y−y^)212(y-y^)2\frac{1}{2}(y-\hat y)^2yyyy^y^\hat yxXx 1 …

4
Quel est l'avantage de diviser le fichier tfrecord en fragments?
Je travaille sur la reconnaissance vocale avec Tensorflow et je prévois de former LSTM NN avec un ensemble de données d'ondes massives. En raison des gains de performances, je prévois d'utiliser des tfrecords. Il existe plusieurs exemples sur Internet (Inception par exemple) où les fichiers tfrecords sont divisés en fragments. …

5
Fusionner des données rares et denses dans l'apprentissage automatique pour améliorer les performances
J'ai des caractéristiques clairsemées qui sont prédictives, j'ai aussi des caractéristiques denses qui sont également prédictives. J'ai besoin de combiner ces fonctionnalités pour améliorer les performances globales du classificateur. Maintenant, le problème est que lorsque j'essaie de les combiner, les entités denses ont tendance à dominer davantage les entités clairsemées, …







En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.