Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées




1
XGBoost pour la classification binaire: choisir le bon seuil
Je travaille sur un ensemble de données à étiquetage binaire très déséquilibré, où le nombre de véritables étiquettes est à seulement 7% de l'ensemble de données. Mais une combinaison de fonctionnalités pourrait produire un nombre supérieur à la moyenne de celles d'un sous-ensemble. Par exemple, nous avons le jeu de …

4
Les circonvolutions «aplatissent-elles les images»?
Je suis à la recherche d'une bonne explication du fonctionnement des circonvolutions dans l'apprentissage profond lorsqu'elles sont appliquées à des images multicanaux. Par exemple, disons que j'ai une image de 100 x 100 pixels avec trois canaux, RVB. Le tenseur d'entrée aurait alors des dimensions 100 x 100 x 3. …

2
Gain d'informations en R
J'ai trouvé des packages utilisés pour calculer le "gain d'informations" pour sélectionner les principaux attributs dans l'arbre de décision C4.5 et j'ai essayé de les utiliser pour calculer le "gain d'informations". Mais les résultats du calcul de chaque paquet sont différents comme le code ci-dessous. > IG.CORElearn <- attrEval(In_Occu ~ …

3
De quelles connaissances ai-je besoin pour écrire un simple programme d'IA pour jouer à un jeu?
Je suis diplômé du B.Sc. L'un de mes cours était «Introduction à l'apprentissage automatique», et j'ai toujours voulu faire un projet personnel dans ce sujet. J'ai récemment entendu parler de différentes formations à l'IA pour jouer à des jeux tels que Mario, Go, etc. Quelles connaissances dois-je acquérir pour former …

1
Apprentissage automatique: écrire des poèmes
Je suis un étudiant en apprentissage automatique et ces jours-ci, j'essayais d'apprendre à utiliser la bibliothèque TensorFlow. J'ai parcouru divers tutoriels et essais et erreurs avec tensorflow, et je pensais que la meilleure façon de l'apprendre pour de vrai serait de l'utiliser dans un petit projet à moi. J'ai décidé …

4
Classe non équilibrée: class_weight pour les algorithmes ML dans Spark MLLib
Dans python sklearn, il existe plusieurs algorithmes (par exemple la régression, la forêt aléatoire ... etc.) qui ont le paramètre class_weight pour gérer les données non équilibrées. Cependant, je ne trouve pas un tel paramètre pour les algorithmes MLLib. Existe-t-il un plan d'implémentation de class_weight pour certains algorithmes MLLib? Ou …





3
Comment évaluer le clustering de texte?
Quelles mesures peuvent être utilisées pour évaluer les modèles de clustering de texte? J'ai utilisé tf-idf+ k-means, tf-idf+ hierarchical clustering, doc2vec+ k-means (metric is cosine similarity), doc2vec+ hierarchical clustering (metric is cosine similarity). Comment décider quel modèle est le meilleur?


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.