Questions marquées «scikit-learn»

Scikit-learn est un module Python comprenant un outil simple et efficace pour l'apprentissage automatique, l'exploration de données et l'analyse de données. Il est construit sur NumPy, SciPy et matplotlib. Il est distribué sous la licence BSD 3-Clause.

3
Relation entre la convolution en mathématiques et CNN
J'ai lu l' explication de la convolution et je la comprends dans une certaine mesure. Quelqu'un peut-il m'aider à comprendre comment cette opération est liée à la convolution dans les réseaux neuronaux convolutionnels? Le filtre est-il une fonction gqui applique du poids?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3


1
Des données déséquilibrées provoquent une mauvaise classification sur l'ensemble de données multiclasses
Je travaille sur la classification des textes où j'ai 39 catégories / classes et 8,5 millions d'enregistrements. (À l'avenir, les données et les catégories augmenteront). La structure ou le format de mes données est le suivant. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display …

4
Interprétation de l'arbre de décision dans le contexte de l'importance des fonctionnalités
J'essaie de comprendre comment comprendre pleinement le processus de décision d'un modèle de classification d'arbre de décision construit avec sklearn. Les 2 principaux aspects que je regarde sont une représentation graphique de l'arbre et la liste des importances de fonctionnalités. Ce que je ne comprends pas, c'est comment l'importance des …




1
La confiance de l'étiquette de formation peut-elle être utilisée pour améliorer la précision des prédictions?
J'ai des données d'entraînement étiquetées avec des valeurs binaires. J'ai également recueilli la confiance de chacune de ces étiquettes, c'est-à-dire que 0,8 confiance signifierait que 80% des étiqueteurs humains sont d'accord sur cette étiquette. Est-il possible d'utiliser ces données de confiance pour améliorer la précision de mon classificateur? Est-ce que …

2
Comment former un modèle pour prédire des événements 30 minutes avant, à partir d'une série temporelle multidimensionnelle
Les experts dans mon domaine sont capables de prédire la probabilité d'un événement (pic binaire en jaune) 30 minutes avant qu'il ne se produise . La fréquence est ici de 1 seconde, cette vue représente quelques heures de données, j'ai encerclé en noir où devrait se trouver un motif "malveillant" …

2
Pourquoi la régression de renforcement du gradient prévoit-elle des valeurs négatives lorsqu'il n'y a pas de valeurs y négatives dans mon ensemble d'entraînement?
À mesure que j'augmente le nombre d'arbres dans scikit learn 's GradientBoostingRegressor, j'obtiens de plus en plus de prédictions négatives, même s'il n'y a pas de valeurs négatives dans mon ensemble d'entraînement ou de test. J'ai environ 10 fonctionnalités, dont la plupart sont binaires. Certains des paramètres que je réglais …

3
Validation croisée imbriquée et sélection du meilleur modèle de régression - est-ce le bon processus SKLearn?
Si je comprends bien, le CV imbriqué peut m'aider à évaluer le meilleur modèle et le processus de réglage d'hyperparamètre. La boucle interne ( GridSearchCV) trouve les meilleurs hyperparamètres et la boucle externe ( cross_val_score) évalue l'algorithme de réglage des hyperparamètres. Je choisis ensuite le combo réglage / modèle de …

1
sklearn - problème de surajustement
Je recherche des recommandations sur la meilleure façon de résoudre mon problème actuel d'apprentissage automatique Le contour du problème et ce que j'ai fait est le suivant: J'ai plus de 900 essais de données EEG, où chaque essai dure 1 seconde. La vérité fondamentale est connue pour chacun et classe …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.