Questions marquées «scikit-learn»

scikit-learn est une bibliothèque d'apprentissage automatique pour Python qui fournit des outils simples et efficaces pour l'analyse de données et l'exploration de données, en mettant l'accent sur l'apprentissage automatique. Il est accessible à tous et réutilisable dans divers contextes. Il est construit sur NumPy et SciPy. Le projet est open source et commercialement utilisable (licence BSD).

8
Un vecteur de colonne y a été transmis lorsqu'un tableau 1d était attendu
Je dois répondre à RandomForestRegressorpartir sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Ce code a toujours fonctionné jusqu'à ce que je fasse un prétraitement des données ( train_y). Le message d'erreur dit: DataConversionWarning: Un vecteur de colonne y a été transmis lorsqu'un tableau 1d était attendu. …


13
ImportError lors de l'importation depuis sklearn: impossible d'importer le nom check_build
J'obtiens l'erreur suivante en essayant d'importer depuis sklearn: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build J'utilise python 2.7, scipy-0.12.0b1 superpack, numpy-1.6.0 superpack, …


2
Comment fonctionne le paramètre class_weight dans scikit-learn?
J'ai beaucoup de mal à comprendre comment fonctionne le class_weightparamètre de la régression logistique de scikit-learn. La situation Je souhaite utiliser la régression logistique pour effectuer une classification binaire sur un ensemble de données très déséquilibré. Les classes sont étiquetées 0 (négatif) et 1 (positif) et les données observées sont …


4
Comment calculer la précision, le rappel, l'exactitude et le score f1 pour le cas multiclasse avec scikit learn?
Je travaille sur un problème d'analyse des sentiments, les données ressemblent à ceci: label instances 5 1190 4 838 3 239 1 204 2 127 Donc mes données sont déséquilibrées puisque 1190 instancessont étiquetées avec 5. Pour la classification Im utilisant le SVC de scikit . Le problème est que …




11
sklearn: a trouvé des tableaux avec un nombre d'échantillons incohérent lors de l'appel de LinearRegression.fit ()
J'essaie juste de faire une simple régression linéaire mais je suis déconcerté par cette erreur pour: regr = LinearRegression() regr.fit(df2.iloc[1:1000, 5].values, df2.iloc[1:1000, 2].values) qui produit: ValueError: Found arrays with inconsistent numbers of samples: [ 1 999] Ces sélections doivent avoir les mêmes dimensions, et elles doivent être des tableaux numpy, …
102 scikit-learn 

3
RandomForestClassifier vs ExtraTreesClassifier dans Scikit Learn
Quelqu'un peut-il expliquer la différence entre RandomForestClassifier et ExtraTreesClassifier dans scikit learn. J'ai passé un bon moment à lire l'article: P. Geurts, D. Ernst., Et L. Wehenkel, «Arbres extrêmement aléatoires», Machine Learning, 63 (1), 3-42, 2006 Il semble que ce soit la différence pour ET: 1) Lors du choix des …


7
Train stratifié / Test-split dans scikit-learn
Je dois diviser mes données en un ensemble d'entraînement (75%) et un ensemble de test (25%). Je le fais actuellement avec le code ci-dessous: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) Cependant, j'aimerais stratifier mon ensemble de données d'entraînement. Comment je fais ça? J'ai étudié la StratifiedKFoldméthode, mais ne me …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.