Science des données

10

Que sont les couches déconvolutionnelles?

J'ai récemment lu des réseaux entièrement convolutionnels pour la segmentation sémantique par Jonathan Long, Evan Shelhamer et Trevor Darrell. Je ne comprends pas ce que font les "couches déconvolutionnelles" / comment elles fonctionnent. La partie pertinente est 3.3. L'échantillonnage est une convolution à pas en arrière L'interpolation est un autre …

188 neural-network convnet convolution

30

Jeux de données disponibles publiquement

L'un des problèmes courants de la science des données est la collecte de données provenant de diverses sources dans un format (semi-structuré) en quelque sorte nettoyé et la combinaison de métriques provenant de différentes sources pour effectuer une analyse de niveau supérieur. En regardant les efforts des autres, en particulier …

168 open-source dataset

13

Regroupement K-Means pour des données numériques et catégoriques mixtes

Mon ensemble de données contient un certain nombre d'attributs numériques et un catégorique. Dis NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, où CategoricalAttrprend l' une des trois valeurs possibles: CategoricalAttrValue1, CategoricalAttrValue2ou CategoricalAttrValue3. J'utilise l'algorithme de clustering k-means par défaut pour Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Cela fonctionne uniquement avec des données numériques. Ma question …

133 data-mining clustering octave k-means categorical-data

17

Meilleure librairie python pour réseaux de neurones

J'utilise des réseaux de neurones pour résoudre différents problèmes d'apprentissage machine. J'utilise Python et Pybrain mais cette bibliothèque est presque abandonnée. Existe-t-il d'autres bonnes alternatives en Python?

130 machine-learning python neural-network

8

Comment définir les poids de classe pour les classes déséquilibrées dans Keras?

Je sais qu'il existe une possibilité dans Keras avec le class_weightsdictionnaire de paramètres lors de l'ajustement, mais je n'ai trouvé aucun exemple. Quelqu'un aurait-il la gentillesse d'en fournir un? À propos, dans ce cas, la pratique appropriée consiste simplement à pondérer la classe minoritaire proportionnellement à sa sous-représentation.

130 classification keras weighted-data

5

Quel est le problème de "mourant ReLU" dans les réseaux de neurones?

En référence aux notes de cours de Stanford sur les réseaux de neurones convolutionnels pour la reconnaissance visuelle , un paragraphe dit: "Malheureusement, les unités ReLU peuvent être fragiles pendant l'entraînement et peuvent" mourir ". Par exemple, un gradient important traversant un neurone ReLU peut entraîner une mise à jour …

119 machine-learning neural-network deep-learning

5

La fonction d'erreur d'entropie croisée dans les réseaux de neurones

Dans le MNIST For ML Beginners, ils définissent l’entropie croisée comme Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) i y ' iyiyiy_i est la valeur de probabilité prédite pour la classe et est la probabilité vraie pour cette classe.iiiy′iyi′y_i' question 1 N'est-ce pas un problème que (dans ) puisse …

115 machine-learning tensorflow

8

Différence entre fit et fit_transform dans les modèles scikit_learn?

Je suis débutant en science des données et je ne comprends pas la différence entre les méthodes fitet les fit_transformméthodes de scikit-learn. Quelqu'un peut-il simplement expliquer pourquoi nous pourrions avoir besoin de transformer des données? Qu'est-ce que cela signifie d'ajuster le modèle sur les données d'apprentissage et de le transformer …

110 python scikit-learn

6

Performance micro moyenne vs macro moyenne dans un paramètre de classification multiclass

J'essaie un paramètre de classification multiclass avec 3 classes. La distribution des classes est asymétrique, la plupart des données tombant dans l'une des trois classes. (les étiquettes de classe sont 1, 2, 3, avec 67,28% des données relevant de l'étiquette de classe 1, 11,99% des données de classe 2 et …

103 multiclass-classification evaluation

15

Python vs R pour l'apprentissage automatique

Je commence tout juste à développer une application d' apprentissage automatique à des fins académiques. J'utilise actuellement R et m'entraîne moi-même. Cependant, dans de nombreux endroits, j'ai vu des personnes utiliser Python . Qu'est-ce que les gens utilisent dans les universités et l'industrie et quelle est la recommandation?

101 machine-learning r python

3

Quand utiliser One Hot Encoding vs LabelEncoder vs DictVectorizor?

Je construis des modèles avec des données catégoriques depuis un certain temps et lorsque, dans cette situation, je par défaut utilise par défaut la fonction LabelEncoder de scikit-learn pour transformer ces données avant de créer un modèle. Je comprends la différence entre OHE, LabelEncoderet DictVectorizoren termes de ce qu'ils font …

98 scikit-learn categorical-data feature-engineering

6

Quand utiliser GRU sur LSTM?

La principale différence entre une GRU et un LSTM réside dans le fait qu’une GRU a deux portes (portes de réinitialisation et de mise à jour ) alors qu’un LSTM a trois portes (à savoir les portes d’ entrée , de sortie et d’ oubli ). Pourquoi utilisons-nous GRU alors …

95 neural-network deep-learning

12

Quelle est la taille des données volumineuses?

Beaucoup de gens utilisent le terme mégadonnées de manière plutôt commerciale pour indiquer que de grands ensembles de données sont impliqués dans le calcul et que, par conséquent, les solutions potentielles doivent être performantes. Bien entendu, le big data contient toujours des termes associés, tels que scalabilité et efficacité, mais …

86 bigdata scalability efficiency performance

8

Choisir un taux d'apprentissage

Je travaille actuellement sur la mise en œuvre de la descente de gradient stochastique SGD, pour les réseaux neuronaux utilisant la rétrodiffusion, et bien que je comprenne son objectif, j'ai quelques questions sur la manière de choisir des valeurs pour le taux d'apprentissage. Le taux d'apprentissage est-il lié à la …

85 machine-learning neural-network deep-learning optimization hyperparameter

15

Comment visualisez-vous les architectures de réseaux de neurones?

Lors de la rédaction d'un article / d'une présentation sur un sujet concernant les réseaux de neurones, on visualise généralement l'architecture du réseau. Quels sont les moyens bons / simples de visualiser automatiquement les architectures communes?

80 machine-learning neural-network deep-learning visualization