Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées




4
Comment faire une correspondance floue des adresses postales?
Je voudrais savoir comment faire correspondre les adresses postales lorsque leur format diffère ou lorsque l'une d'elles est mal orthographiée. Jusqu'à présent, j'ai trouvé différentes solutions mais je pense qu'elles sont assez anciennes et peu efficaces. Je suis sûr qu'il existe de meilleures méthodes, donc si vous avez des références …

1
Les points de rapprochement peuvent-ils être considérés comme plus similaires dans la visualisation T-SNE?
Je comprends d'après l'article de Hinton que le T-SNE fait un bon travail en gardant les similitudes locales et un travail décent en préservant la structure mondiale (clusterisation). Cependant, je ne sais pas si les points apparaissant plus proches dans une visualisation 2D t-sne peuvent être supposés comme des points …

4
Arbre de décision ou régression logistique?
Je travaille sur un problème de classification. J'ai un ensemble de données contenant un nombre égal de variables catégorielles et de variables continues. Comment saurai-je quelle technique utiliser? entre un arbre de décision et une régression logistique? Est-il juste de supposer que la régression logistique sera plus appropriée pour la …



1
Bibliothèques d'apprentissage automatique pour Ruby
Existe-t-il des bibliothèques d'apprentissage automatique pour Ruby qui sont relativement complètes (y compris une grande variété d'algorithmes pour l'apprentissage supervisé et non supervisé), testées de manière robuste et bien documentées? J'adore scikit-learn de Python pour sa documentation incroyable, mais un client préfère écrire le code dans Ruby car c'est ce …


4
Quelles sont les implications pour la formation d'un ensemble d'arbres avec des ensembles de données fortement biaisés?
J'ai un ensemble de données binaires très biaisé - j'ai 1000 fois plus d'exemples de la classe négative que de la classe positive. J'aimerais former un ensemble d'arbres (comme des arbres aléatoires supplémentaires ou une forêt aléatoire) sur ces données, mais il est difficile de créer des ensembles de données …



1
Comment ajouter des fonctionnalités sans image le long des images latérales en tant qu'entrée des CNN
J'entraîne un réseau neuronal convolutionnel pour classer les images sur les conditions de brouillard (3 classes). Cependant, pour chacune des 150 000 images environ, j'ai également quatre variables météorologiques disponibles qui pourraient aider à prévoir les classes d'images. Je me demandais comment je pourrais ajouter les variables météorologiques (par exemple …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.