Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées

6
Ensembles de données comprenant les meilleures pratiques
Je suis un étudiant en master CS en data mining. Mon superviseur m'a dit une fois qu'avant d'exécuter un classificateur ou de faire quoi que ce soit avec un ensemble de données, je dois bien comprendre les données et m'assurer que les données sont propres et correctes. Mes questions: Quelles …

4
Étude de cas Big Data ou exemple de cas d'utilisation
J'ai lu beaucoup de blogs \ article sur la façon dont différents types d'industries utilisent Big Data Analytic. Mais la plupart de ces articles ne mentionnent pas Quel genre de données ces entreprises ont utilisé. Quelle était la taille des données Quels types de technologies d'outils ont-ils utilisés pour traiter …

5
Pourquoi l'ajout d'une couche d'abandon améliore-t-il les performances d'apprentissage profond / machine, étant donné que l'abandon supprime certains neurones du modèle?
Si la suppression de certains neurones donne un modèle plus performant, pourquoi ne pas utiliser un réseau neuronal plus simple avec moins de couches et moins de neurones en premier lieu? Pourquoi construire un modèle plus grand et plus compliqué au début et en supprimer des parties plus tard?

3
Qu'est-ce que l'intégration de graphiques?
Je suis récemment tombé sur l'intégration de graphiques tels que DeepWalk et LINE. Cependant, je n'ai toujours pas une idée claire de ce que l'on entend par intégration de graphiques et quand l'utiliser (applications)? Toutes les suggestions sont les bienvenues!
13 graphs 





1
Comment le biais devrait-il être initialisé et régularisé?
J'ai lu quelques articles sur l'initialisation du noyau et de nombreux articles mentionnent qu'ils utilisent la régularisation L2 du noyau (souvent avec ).λ=0.0001λ=0.0001\lambda = 0.0001 Quelqu'un fait-il autre chose que d'initialiser le biais avec un zéro constant et de ne pas le régulariser? Documents d'initialisation du noyau Mishkin et Matas: …






2
Échelle éthique et rentable Scrapes de données
Peu de choses dans la vie me font plaisir comme gratter des données structurées et non structurées d'Internet et les utiliser dans mes modèles. Par exemple, le Data Science Toolkit (ou RDSTKpour les programmeurs R) me permet d'extraire de nombreuses bonnes données géolocalisées en utilisant des adresses IP ou des …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.