Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées

10
Que sont les couches déconvolutionnelles?
J'ai récemment lu des réseaux entièrement convolutionnels pour la segmentation sémantique par Jonathan Long, Evan Shelhamer et Trevor Darrell. Je ne comprends pas ce que font les "couches déconvolutionnelles" / comment elles fonctionnent. La partie pertinente est 3.3. L'échantillonnage est une convolution à pas en arrière L'interpolation est un autre …

30
Jeux de données disponibles publiquement
L'un des problèmes courants de la science des données est la collecte de données provenant de diverses sources dans un format (semi-structuré) en quelque sorte nettoyé et la combinaison de métriques provenant de différentes sources pour effectuer une analyse de niveau supérieur. En regardant les efforts des autres, en particulier …

13
Regroupement K-Means pour des données numériques et catégoriques mixtes
Mon ensemble de données contient un certain nombre d'attributs numériques et un catégorique. Dis NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, où CategoricalAttrprend l' une des trois valeurs possibles: CategoricalAttrValue1, CategoricalAttrValue2ou CategoricalAttrValue3. J'utilise l'algorithme de clustering k-means par défaut pour Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Cela fonctionne uniquement avec des données numériques. Ma question …




5
La fonction d'erreur d'entropie croisée dans les réseaux de neurones
Dans le MNIST For ML Beginners, ils définissent l’entropie croisée comme Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) i y ' iyiyiy_i est la valeur de probabilité prédite pour la classe et est la probabilité vraie pour cette classe.iiiy′iyi′y_i' question 1 N'est-ce pas un problème que (dans ) puisse …

8
Différence entre fit et fit_transform dans les modèles scikit_learn?
Je suis débutant en science des données et je ne comprends pas la différence entre les méthodes fitet les fit_transformméthodes de scikit-learn. Quelqu'un peut-il simplement expliquer pourquoi nous pourrions avoir besoin de transformer des données? Qu'est-ce que cela signifie d'ajuster le modèle sur les données d'apprentissage et de le transformer …


15
Python vs R pour l'apprentissage automatique
Je commence tout juste à développer une application d' apprentissage automatique à des fins académiques. J'utilise actuellement R et m'entraîne moi-même. Cependant, dans de nombreux endroits, j'ai vu des personnes utiliser Python . Qu'est-ce que les gens utilisent dans les universités et l'industrie et quelle est la recommandation?


6
Quand utiliser GRU sur LSTM?
La principale différence entre une GRU et un LSTM réside dans le fait qu’une GRU a deux portes (portes de réinitialisation et de mise à jour ) alors qu’un LSTM a trois portes (à savoir les portes d’ entrée , de sortie et d’ oubli ). Pourquoi utilisons-nous GRU alors …

12
Quelle est la taille des données volumineuses?
Beaucoup de gens utilisent le terme mégadonnées de manière plutôt commerciale pour indiquer que de grands ensembles de données sont impliqués dans le calcul et que, par conséquent, les solutions potentielles doivent être performantes. Bien entendu, le big data contient toujours des termes associés, tels que scalabilité et efficacité, mais …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.