J'ai récemment lu des réseaux entièrement convolutionnels pour la segmentation sémantique par Jonathan Long, Evan Shelhamer et Trevor Darrell. Je ne comprends pas ce que font les "couches déconvolutionnelles" / comment elles fonctionnent. La partie pertinente est 3.3. L'échantillonnage est une convolution à pas en arrière L'interpolation est un autre …
L'un des problèmes courants de la science des données est la collecte de données provenant de diverses sources dans un format (semi-structuré) en quelque sorte nettoyé et la combinaison de métriques provenant de différentes sources pour effectuer une analyse de niveau supérieur. En regardant les efforts des autres, en particulier …
Mon ensemble de données contient un certain nombre d'attributs numériques et un catégorique. Dis NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, où CategoricalAttrprend l' une des trois valeurs possibles: CategoricalAttrValue1, CategoricalAttrValue2ou CategoricalAttrValue3. J'utilise l'algorithme de clustering k-means par défaut pour Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Cela fonctionne uniquement avec des données numériques. Ma question …
J'utilise des réseaux de neurones pour résoudre différents problèmes d'apprentissage machine. J'utilise Python et Pybrain mais cette bibliothèque est presque abandonnée. Existe-t-il d'autres bonnes alternatives en Python?
Je sais qu'il existe une possibilité dans Keras avec le class_weightsdictionnaire de paramètres lors de l'ajustement, mais je n'ai trouvé aucun exemple. Quelqu'un aurait-il la gentillesse d'en fournir un? À propos, dans ce cas, la pratique appropriée consiste simplement à pondérer la classe minoritaire proportionnellement à sa sous-représentation.
En référence aux notes de cours de Stanford sur les réseaux de neurones convolutionnels pour la reconnaissance visuelle , un paragraphe dit: "Malheureusement, les unités ReLU peuvent être fragiles pendant l'entraînement et peuvent" mourir ". Par exemple, un gradient important traversant un neurone ReLU peut entraîner une mise à jour …
Dans le MNIST For ML Beginners, ils définissent l’entropie croisée comme Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) i y ' iyiyiy_i est la valeur de probabilité prédite pour la classe et est la probabilité vraie pour cette classe.iiiy′iyi′y_i' question 1 N'est-ce pas un problème que (dans ) puisse …
Je suis débutant en science des données et je ne comprends pas la différence entre les méthodes fitet les fit_transformméthodes de scikit-learn. Quelqu'un peut-il simplement expliquer pourquoi nous pourrions avoir besoin de transformer des données? Qu'est-ce que cela signifie d'ajuster le modèle sur les données d'apprentissage et de le transformer …
J'essaie un paramètre de classification multiclass avec 3 classes. La distribution des classes est asymétrique, la plupart des données tombant dans l'une des trois classes. (les étiquettes de classe sont 1, 2, 3, avec 67,28% des données relevant de l'étiquette de classe 1, 11,99% des données de classe 2 et …
Je commence tout juste à développer une application d' apprentissage automatique à des fins académiques. J'utilise actuellement R et m'entraîne moi-même. Cependant, dans de nombreux endroits, j'ai vu des personnes utiliser Python . Qu'est-ce que les gens utilisent dans les universités et l'industrie et quelle est la recommandation?
Je construis des modèles avec des données catégoriques depuis un certain temps et lorsque, dans cette situation, je par défaut utilise par défaut la fonction LabelEncoder de scikit-learn pour transformer ces données avant de créer un modèle. Je comprends la différence entre OHE, LabelEncoderet DictVectorizoren termes de ce qu'ils font …
La principale différence entre une GRU et un LSTM réside dans le fait qu’une GRU a deux portes (portes de réinitialisation et de mise à jour ) alors qu’un LSTM a trois portes (à savoir les portes d’ entrée , de sortie et d’ oubli ). Pourquoi utilisons-nous GRU alors …
Beaucoup de gens utilisent le terme mégadonnées de manière plutôt commerciale pour indiquer que de grands ensembles de données sont impliqués dans le calcul et que, par conséquent, les solutions potentielles doivent être performantes. Bien entendu, le big data contient toujours des termes associés, tels que scalabilité et efficacité, mais …
Je travaille actuellement sur la mise en œuvre de la descente de gradient stochastique SGD, pour les réseaux neuronaux utilisant la rétrodiffusion, et bien que je comprenne son objectif, j'ai quelques questions sur la manière de choisir des valeurs pour le taux d'apprentissage. Le taux d'apprentissage est-il lié à la …
Lors de la rédaction d'un article / d'une présentation sur un sujet concernant les réseaux de neurones, on visualise généralement l'architecture du réseau. Quels sont les moyens bons / simples de visualiser automatiquement les architectures communes?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.