Questions marquées «deep-learning»

Le Deep Learning est un domaine d'apprentissage automatique dont le but est d'apprendre des fonctions complexes à l'aide d'architectures de réseau neuronal spéciales qui sont «profondes» (composées de plusieurs couches). Cette balise doit être utilisée pour les questions sur la mise en œuvre d'architectures d'apprentissage en profondeur. Les questions générales d'apprentissage automatique doivent être étiquetées «apprentissage automatique». Inclure une balise pour la bibliothèque logicielle appropriée (par exemple, "keras", "tensorflow", "pytorch", "fast.ai" et etc.) est utile.


3
Comprendre les LSTM Keras
J'essaie de concilier ma compréhension des LSTM et souligné ici dans ce post par Christopher Olah mis en œuvre à Keras. Je suis le blog écrit par Jason Brownlee pour le tutoriel Keras. Ce qui me trouble le plus, c'est Le remodelage de la série de données en [samples, time …




3
Comment interpréter la «perte» et la «précision» pour un modèle d'apprentissage automatique
Lorsque j'entraînerai mon réseau de neurones avec Theano ou Tensorflow, ils rapporteront une variable appelée "perte" par époque. Comment dois-je interpréter cette variable? Une perte plus élevée est meilleure ou pire, ou qu'est-ce que cela signifie pour les performances finales (précision) de mon réseau de neurones?

5
Le meilleur moyen d'enregistrer un modèle entraîné dans PyTorch?
Je cherchais des moyens alternatifs pour enregistrer un modèle entraîné dans PyTorch. Jusqu'à présent, j'ai trouvé deux alternatives. torch.save () pour enregistrer un modèle et torch.load () pour charger un modèle. model.state_dict () pour enregistrer un modèle entraîné et model.load_state_dict () pour charger le modèle enregistré. Je suis tombé sur …

11
Pourquoi binary_crossentropy et categorical_crossentropy donnent des performances différentes pour le même problème?
J'essaie de former un CNN à catégoriser le texte par sujet. Lorsque j'utilise l'entropie croisée binaire, j'obtiens une précision d'environ 80%, avec une entropie croisée catégorique, j'obtiens une précision d'environ 50%. Je ne comprends pas pourquoi. C'est un problème multiclasse, cela ne signifie-t-il pas que je dois utiliser une entropie …

8
Que fait la fonction tf.nn.embedding_lookup?
tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) Je ne peux pas comprendre le devoir de cette fonction. Est-ce comme une table de consultation? Quels moyens de retourner les paramètres correspondant à chaque id (en ids)? Par exemple, dans le skip-grammodèle si nous utilisons tf.nn.embedding_lookup(embeddings, train_inputs), alors pour chacun, train_inputil trouve l'incorporation correspondante?

10
Keras, comment obtenir la sortie de chaque couche?
J'ai formé un modèle de classification binaire avec CNN, et voici mon code model = Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode='valid', input_shape=input_shape)) model.add(Activation('relu')) model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (16, 16, 32) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (8, 8, 64) = (2048) model.add(Flatten()) model.add(Dense(1024)) model.add(Activation('relu')) model.add(Dropout(0.5)) …

12
Pourquoi une fonction d'activation non linéaire doit-elle être utilisée dans un réseau de neurones à rétropropagation?
J'ai lu certaines choses sur les réseaux neuronaux et je comprends le principe général d'un réseau neuronal monocouche. Je comprends le besoin de couches supplémentaires, mais pourquoi les fonctions d'activation non linéaires sont-elles utilisées? Cette question est suivie de celle-ci: à quoi sert un dérivé de la fonction d'activation en …



5
Quel est le rôle de «Flatten» dans Keras?
J'essaie de comprendre le rôle de la Flattenfonction dans Keras. Voici mon code, qui est un simple réseau à deux couches. Il prend des données bidimensionnelles de forme (3, 2) et produit des données unidimensionnelles de forme (1, 4): model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu')) model.add(Flatten()) model.add(Dense(4)) model.compile(loss='mean_squared_error', optimizer='SGD') …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.