Questions marquées «scikit-learn»

scikit-learn est une bibliothèque d'apprentissage automatique pour Python qui fournit des outils simples et efficaces pour l'analyse de données et l'exploration de données, en mettant l'accent sur l'apprentissage automatique. Il est accessible à tous et réutilisable dans divers contextes. Il est construit sur NumPy et SciPy. Le projet est open source et commercialement utilisable (licence BSD).

20
Étiqueter l'encodage sur plusieurs colonnes dans scikit-learn
J'essaie d'utiliser scikit-learn LabelEncoderpour encoder un pandas DataFramed'étiquettes de chaîne. Comme la trame de données contient de nombreuses (50+) colonnes, je veux éviter de créer un LabelEncoderobjet pour chaque colonne; Je préfère simplement avoir un gros LabelEncoderobjet qui fonctionne dans toutes mes colonnes de données. Lancer le tout DataFramedans LabelEncodercrée …


6
Enregistrer le classificateur sur le disque dans scikit-learn
Comment enregistrer un classificateur Naive Bayes entraîné sur le disque et l'utiliser pour prédire les données? J'ai l'exemple de programme suivant du site Web scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" …

15
ImportError: aucun module nommé sklearn.cross_validation
J'utilise python 2.7 dans Ubuntu 14.04. J'ai installé scikit-learn, numpy et matplotlib avec ces commandes: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython Mais lorsque j'importe ces packages: from sklearn.cross_validation import train_test_split Cela me renvoie cette erreur: ImportError: No module named sklearn.cross_validation Ce que …









13
erreur sklearn ValueError: l'entrée contient NaN, l'infini ou une valeur trop grande pour dtype ('float64')
J'utilise sklearn et j'ai un problème avec la propagation d'affinité. J'ai construit une matrice d'entrée et j'obtiens toujours l'erreur suivante. ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). j'ai couru np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True J'ai essayé d'utiliser mat[np.isfinite(mat) == True] = 0 …

3
Pourquoi un encodage à chaud améliore-t-il les performances d'apprentissage automatique?
J'ai remarqué que lorsque l'encodage One Hot est utilisé sur un ensemble de données particulier (une matrice) et utilisé comme données d'entraînement pour l'apprentissage d'algorithmes, il donne des résultats nettement meilleurs en ce qui concerne la précision de la prédiction, par rapport à l'utilisation de la matrice d'origine elle-même comme …

6
Comment les feature_importances dans RandomForestClassifier sont-elles déterminées?
J'ai une tâche de classification avec une série chronologique comme entrée de données, où chaque attribut (n = 23) représente un moment spécifique. Outre le résultat de la classification absolue, j'aimerais savoir quels attributs / dates contribuent au résultat dans quelle mesure. Par conséquent, j'utilise juste le feature_importances_, qui fonctionne …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.