Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées

1
sklearn - problème de surajustement
Je recherche des recommandations sur la meilleure façon de résoudre mon problème actuel d'apprentissage automatique Le contour du problème et ce que j'ai fait est le suivant: J'ai plus de 900 essais de données EEG, où chaque essai dure 1 seconde. La vérité fondamentale est connue pour chacun et classe …





2
visualiser une boîte à moustaches horizontale dans R
J'ai un ensemble de données comme celui-ci. Les données ont été collectées via un questionnaire et je vais faire une analyse exploratoire des données. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <- c(100,200,300,400,500 ) test<- as.data.frame (cbind(windows,sql,excel,salary),stringsAsFactors=TRUE) test[,"salary"] <- as.numeric(as.character(test[,"salary"] )) J'ai une variable de résultat …

4
Comment apprendre la détection des spams?
Je veux savoir comment fonctionne un détecteur de courrier indésirable. Je n'essaie pas de créer un produit commercial, ce sera un exercice d'apprentissage sérieux pour moi. Par conséquent, je recherche des ressources, telles que des projets existants, du code source, des articles, des articles, etc. que je peux suivre. Je …

1
Theano dans la recherche en apprentissage profond
Dans quelle mesure Theano est-il utilisé dans la recherche en apprentissage profond? Theano est-il un bon début pour apprendre la mise en œuvre d'algorithmes d'apprentissage automatique? Est-ce que l'apprentissage de la mise en œuvre de quelque chose comme un réseau à action directe sera vraiment utile? Les étudiants diplômés mettent-ils …

1
Chunking complexe avec NLTK
J'essaie de comprendre comment utiliser le chunker en cascade de NLTK conformément au chapitre 7 du livre NLTK . Malheureusement, je rencontre quelques problèmes lors de l'exécution de mesures de segmentation non triviales. Commençons par cette phrase: "adventure movies between 2000 and 2015 featuring performances by daniel craig" Je peux …
8 python  nlp  nltk 

3
Algorithme de segmentation des données de séquence
J'ai une grande séquence de vecteurs de longueur N. J'ai besoin d'un algorithme d'apprentissage non supervisé pour diviser ces vecteurs en M segments. Par exemple: K-means ne convient pas, car il place des éléments similaires de différents emplacements dans un seul cluster. Mise à jour: Les vraies données ressemblent à …




3
Graphique interactif lors de l'enregistrement des données
Je cherche à représenter graphiquement et à explorer de manière interactive des données mesurées en direct / en continu. Il existe de nombreuses options, plot.ly étant la plus conviviale. Plot.ly a une interface utilisateur fantastique et facile à utiliser (facilement évolutive, panoramique, facilement zoomable / adaptée à l'écran), mais ne …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.