Support Vector Machine fait référence à "un ensemble de méthodes d'apprentissage supervisé connexes qui analysent les données et reconnaissent les modèles, utilisées pour l'analyse de classification et de régression".
J'ai un ensemble de données de test très déséquilibré. L'ensemble positif se compose de 100 cas tandis que l'ensemble négatif se compose de 1500 cas. Du côté de la formation, j'ai un plus grand bassin de candidats: l'ensemble de formation positive a 1 200 cas et l'ensemble de formation négative …
Donc, je suis un débutant dans le domaine ML et j'essaie de faire un certain classement. Mon objectif est de prédire l'issue d'un événement sportif. J'ai rassemblé quelques données historiques et j'essaie maintenant de former un classificateur. J'ai obtenu environ 1200 échantillons, 0,2 d'entre eux que j'ai séparés à des …
J'ai un ensemble de données de 120 échantillons dans un paramètre de validation croisée 10 fois. Actuellement, je prends les données d'entraînement du premier holdout et fais une validation croisée 5 fois dessus pour choisir les valeurs de gamma et C par recherche dans la grille. J'utilise SVM avec le …
Plus une question générale. J'utilise un SVM rbf pour la modélisation prédictive. Je pense que mon programme actuel a vraiment besoin d'être accéléré. J'utilise scikit learn avec une recherche de grille grossière à fine + validation croisée. Chaque exécution de SVM prend environ une minute, mais avec toutes les itérations, …
Je souhaite essayer d'utiliser les machines à vecteurs de support (SVM) sur mon jeu de données. Avant d'essayer le problème, j'ai été averti que les SVM ne fonctionnaient pas bien sur des données extrêmement déséquilibrées. Dans mon cas, je peux avoir jusqu'à 95-98% 0 et 2-5% 1. J'ai essayé de …
Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte …
Dans mon projet, je souhaite créer un modèle de régression logistique pour prédire la classification binaire (1 ou 0). J'ai 15 variables, dont 2 sont catégoriques, tandis que les autres sont un mélange de variables continues et discrètes. Afin d'adapter un modèle de régression logistique, il m'a été conseillé de …
J'essaie de comprendre l'intuition derrière les SVM du noyau. Maintenant, je comprends comment fonctionne le SVM linéaire, par lequel une ligne de décision est faite qui divise les données du mieux qu'elle peut. Je comprends également le principe derrière le portage de données vers un espace de dimension supérieure, et …
J'ai donc joué avec les SVM et je me demande si c'est une bonne chose à faire: J'ai un ensemble de fonctionnalités continues (0 à 1) et un ensemble de fonctionnalités catégorielles que j'ai converties en variables factices. Dans ce cas particulier, j'encode la date de la mesure dans une …
Lors de la réalisation de la classification SVM linéaire, il est souvent utile de normaliser les données d'entraînement, par exemple en soustrayant la moyenne et en les divisant par l'écart type, puis de mettre à l'échelle les données de test avec la moyenne et l'écart type des données d'entraînement. Pourquoi …
Les endroits que j'ai lus sur la malédiction de la dimensionnalité l'expliquent conjointement avec kNN principalement et les modèles linéaires en général. Je vois régulièrement les meilleurs classeurs de Kaggle utiliser des milliers d'entités sur un ensemble de données qui ne contient pratiquement pas 100 000 points de données. Ils …
Pourquoi sont-ils appelés "machines"? Y a-t-il une origine au mot "machine" utilisé dans ce contexte? (Comme le nom de "programmation linéaire" peut prêter à confusion, mais nous savons pourquoi il est appelé "programmation".)
La perte de charnière peut être définie à l'aide de et la perte de journal peut être définie commemax ( 0 , 1 - yjewTXje)max(0,1-yjewTXje)\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)journal ( 1 + exp( - yjewTXje) )Journal(1+exp(-yjewTXje))\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i)) J'ai les questions suivantes: Y a-t-il des inconvénients à la perte de charnière (par exemple, …
Je sais que la régression logistique trouve un hyperplan qui sépare les échantillons d'entraînement. Je sais également que les machines à vecteurs de support trouvent l'hyperplan avec la marge maximale. Ma question: est-ce que la différence entre la régression logistique (LR) et les machines à vecteurs de support (SVM) est …
SVM gère-t-il un ensemble de données déséquilibré? S'agit-il de paramètres (comme C, ou coût de classification erronée) gérant l'ensemble de données déséquilibré?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.