Questions marquées «classification»

Une instance d'apprentissage supervisé qui identifie la ou les catégories auxquelles appartient une nouvelle instance de jeu de données.

4
Données multi-classes asymétriques
J'ai un ensemble de données qui contient environ 100 000 échantillons de 50 classes. J'utilise SVM avec un noyau RBF pour former et prédire de nouvelles données. Le problème est que l'ensemble de données est biaisé vers différentes classes. Par exemple, Classe 1 - 30 (~ 3% chacune), Classe 31 …

1
Des données déséquilibrées provoquent une mauvaise classification sur l'ensemble de données multiclasses
Je travaille sur la classification des textes où j'ai 39 catégories / classes et 8,5 millions d'enregistrements. (À l'avenir, les données et les catégories augmenteront). La structure ou le format de mes données est le suivant. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display …


4
Classer des séries chronologiques multivariées
J'ai un ensemble de données composé de séries chronologiques (8 points) avec environ 40 dimensions (donc chaque série temporelle est de 8 par 40). Le résultat correspondant (les résultats possibles pour les catégories) est soit 0 soit 1. Quelle serait la meilleure approche pour concevoir un classifieur pour des séries …

2
Classification des séquences vectorielles
Mon ensemble de données est composé de séquences vectorielles. Chaque vecteur a 50 dimensions réelles. Le nombre de vecteurs dans une séquence va de 3-5 à 10-15. En d'autres termes, la longueur d'une séquence n'est pas fixe. Une bonne partie des séquences (pas des vecteurs!) Sont annotées avec une étiquette …


4
Suggérer des ensembles de données de formation sur le classificateur de texte
Quels jeux de données disponibles gratuitement puis-je utiliser pour former un classificateur de texte? Nous essayons d'améliorer l'engagement de nos utilisateurs en lui recommandant le contenu le plus connexe, alors nous avons pensé que si nous classions notre contenu en fonction d'un sac de mots prédéfini, nous pouvons lui recommander …

1
Exploration de données relationnelles sans ILP
J'ai un énorme ensemble de données à partir d'une base de données relationnelle pour laquelle je dois créer un modèle de classification. Normalement, pour cette situation, j'utiliserais la programmation logique inductive (ILP), mais en raison de circonstances spéciales, je ne peux pas le faire. L'autre façon de résoudre ce problème …


1
La confiance de l'étiquette de formation peut-elle être utilisée pour améliorer la précision des prédictions?
J'ai des données d'entraînement étiquetées avec des valeurs binaires. J'ai également recueilli la confiance de chacune de ces étiquettes, c'est-à-dire que 0,8 confiance signifierait que 80% des étiqueteurs humains sont d'accord sur cette étiquette. Est-il possible d'utiliser ces données de confiance pour améliorer la précision de mon classificateur? Est-ce que …


1
Catégorisation des approches pour faire face aux classes déséquilibrées
Quelle est la meilleure façon de catégoriser les approches qui ont été développées pour traiter le problème de classe de déséquilibre? Cet article les classe en: Prétraitement: comprend le suréchantillonnage, le sous-échantillonnage et les méthodes hybrides, Apprentissage sensible aux coûts: comprend les méthodes directes et le méta-apprentissage que celui-ci divise …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.