Science des données classification

1

Classer les clients en fonction de 2 fonctionnalités ET d'une série d'événements chronologiques

J'ai besoin d'aide sur ce qui devrait être ma prochaine étape dans un algorithme que je conçois. En raison des NDA, je ne peux pas divulguer grand-chose, mais je vais essayer d'être générique et compréhensible. Fondamentalement, après plusieurs étapes dans les algorithmes, j'ai ceci: Pour chaque client que j'ai, et …

12 classification clustering time-series

2

Données de sentiment pour Emoji

Pour expérimenter, nous aimerions utiliser les Emoji intégrés dans de nombreux Tweets comme données de vérité / formation au sol pour une analyse quantitative de sénitment simple. Les tweets sont généralement trop peu structurés pour que la PNL fonctionne correctement. Quoi qu'il en soit, il y a 722 Emoji dans …

12 machine-learning classification parsing

3

Classification de texte non structurée

Je vais classer les documents texte non structurés, à savoir les sites Web de structure inconnue. Le nombre de classes auxquelles je classe est limité (à ce stade, je pense qu'il n'y en a pas plus de trois). Quelqu'un at-il une suggestion sur la façon dont je pourrais commencer? L'approche …

12 machine-learning classification text-mining beginner

3

Mesure des performances de différents classificateurs avec différentes tailles d'échantillons

J'utilise actuellement plusieurs classificateurs différents sur diverses entités extraites du texte, et j'utilise la précision / rappel comme résumé de la performance de chaque classificateur distinct dans un ensemble de données donné. Je me demande s'il existe un moyen significatif de comparer les performances de ces classificateurs de manière similaire, …

12 classification performance

1

Quelle est la différence entre les méthodes de compression globale et universelle?

Je comprends que les méthodes de compression peuvent être divisées en deux ensembles principaux: global local Le premier ensemble fonctionne indépendamment des données en cours de traitement, c'est-à-dire qu'ils ne s'appuient sur aucune caractéristique des données et n'ont donc pas besoin d'effectuer de prétraitement sur aucune partie de l'ensemble de …

12 classification algorithms encoding

1

Combien de cellules LSTM dois-je utiliser?

Existe-t-il des règles générales (ou des règles réelles) concernant la quantité minimale, maximale et "raisonnable" de cellules LSTM que je devrais utiliser? Plus précisément, je me rapporte à BasicLSTMCell de TensorFlow et à la num_unitspropriété. Veuillez supposer que j'ai un problème de classification défini par: t - number of time …

12 rnn machine-learning r predictive-modeling random-forest python language-model sentiment-analysis encoding machine-learning deep-learning neural-network dataset caffe classification xgboost multiclass-classification unbalanced-classes time-series descriptive-statistics python r clustering machine-learning python deep-learning tensorflow machine-learning python predictive-modeling probability scikit-learn svm machine-learning python classification gradient-descent regression research python neural-network deep-learning convnet keras python tensorflow machine-learning deep-learning tensorflow python r bigdata visualization rstudio pandas pyspark dataset time-series multilabel-classification machine-learning neural-network ensemble-modeling kaggle machine-learning linear-regression cnn convnet machine-learning tensorflow association-rules machine-learning predictive-modeling training model-selection neural-network keras deep-learning deep-learning convnet image-classification predictive-modeling prediction machine-learning python classification predictive-modeling scikit-learn machine-learning python random-forest sampling training recommender-system books python neural-network nlp deep-learning tensorflow python matlab information-retrieval search search-engine deep-learning convnet keras machine-learning python cross-validation sampling machine-learning

2

Comment calculer la dimension VC?

Im étudie l'apprentissage automatique, et je voudrais savoir comment calculer la dimension VC. Par exemple: h ( x ) = { 10si a≤x≤bautre h(x)={1if a≤x≤b0else h(x)=\begin{cases} 1 &\mbox{if } a\leq x \leq b \\ 0 & \mbox{else } \end{cases} , avec les paramètres( a , b ) ∈ R2(a,b)∈R2(a,b) ∈ …

12 machine-learning classification vc-theory

4

Comment le principe de rasoir d'Occam fonctionnera-t-il dans le Machine Learning

La question suivante affichée dans l'image a été posée récemment lors d'un des examens. Je ne sais pas si j'ai bien compris le principe du rasoir d'Occam ou non. Selon les distributions et les limites de décision données dans la question et après le rasoir d'Occam, la limite de décision …

11 machine-learning classification

3

Existe-t-il de bons modèles de langage prêts à l'emploi pour python?

Je prototype une application et j'ai besoin d'un modèle de langage pour calculer la perplexité sur certaines phrases générées. Existe-t-il un modèle de langage formé en python que je peux facilement utiliser? Quelque chose de simple comme model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = …

11 python nlp language-model r statistics linear-regression machine-learning classification random-forest xgboost python sampling data-mining orange predictive-modeling recommender-system statistics dimensionality-reduction pca machine-learning python deep-learning keras reinforcement-learning neural-network image-classification r dplyr deep-learning keras tensorflow lstm dropout machine-learning sampling categorical-data data-imputation machine-learning deep-learning machine-learning-model dropout deep-network pandas data-cleaning data-science-model aggregation python neural-network reinforcement-learning policy-gradients r dataframe dataset statistics prediction forecasting r k-means python scikit-learn labels python orange cloud-computing machine-learning neural-network deep-learning rnn recurrent-neural-net logistic-regression missing-data deep-learning autoencoder apache-hadoop time-series data preprocessing classification predictive-modeling time-series machine-learning python feature-selection autoencoder deep-learning keras tensorflow lstm word-embeddings predictive-modeling prediction machine-learning-model machine-learning classification binary theory machine-learning neural-network time-series lstm rnn neural-network deep-learning keras tensorflow convnet computer-vision

1

Utiliser un classificateur CNN pré-formé et l'appliquer sur un ensemble de données d'image différent

Comment pourriez-vous optimiser un pré-formé neural network pour l'appliquer à un problème distinct? Souhaitez-vous simplement ajouter plus de couches au modèle pré-formé et le tester sur votre ensemble de données? Par exemple, si la tâche consistait à utiliser un CNN pour classer les groupes de papiers peints , je suis …

11 neural-network deep-learning classification convnet

2

Quand disons-nous que l'ensemble de données n'est pas classifiable?

J'ai souvent analysé un ensemble de données sur lequel je ne pouvais pas vraiment faire de classification. Pour voir si je peux obtenir un classificateur, j'ai généralement utilisé les étapes suivantes: Générez des tracés d'étiquette par rapport aux valeurs numériques. Réduisez la dimensionnalité à 2 ou 3 pour voir si …

11 machine-learning classification deep-learning class-imbalance bayes-error

2

Classification de documents à l'aide d'un réseau neuronal convolutif

J'essaie d'utiliser CNN (réseau neuronal convolutionnel) pour classer les documents. CNN pour les textes / phrases courts a été étudié dans de nombreux articles. Cependant, il semble qu'aucun article n'ait utilisé CNN pour un texte ou un document long. Mon problème est qu'il y a trop de fonctionnalités d'un document. …

11 classification neural-network text-mining convnet word2vec

3

Classes déséquilibrées - Comment minimiser les faux négatifs?

J'ai un ensemble de données qui a un attribut de classe binaire. Il y a 623 instances de classe +1 (cancer positif) et 101 671 instances de classe -1 (cancer négatif). J'ai essayé divers algorithmes (Naive Bayes, Random Forest, AODE, C4.5) et tous ont des taux de faux négatifs inacceptables. …

11 classification random-forest decision-trees unbalanced-classes

3

Construire un classificateur binaire avec uniquement des données positives et sans étiquette

J'ai 2 jeux de données, un avec des instances positives de ce que je voudrais détecter et un avec des instances sans étiquette. Quelles méthodes puis-je utiliser? Par exemple, supposons que nous voulons comprendre la détection des e-mails de spam sur la base de quelques caractéristiques structurées des e-mails. Nous …

11 classification semi-supervised-learning

4

Algorithme de génération de règles de classification

Nous avons donc un potentiel pour une application d'apprentissage automatique qui s'intègre assez bien dans le domaine de problème traditionnel résolu par les classificateurs, c'est-à-dire que nous avons un ensemble d'attributs décrivant un élément et un "compartiment" dans lequel ils se retrouvent. Cependant, plutôt que de créer des modèles de …

11 machine-learning classification

Questions marquées «classification»