Statistiques et Big Data classification

5

Que signifie AUC et qu'est-ce que c'est?

Cherché haut et bas et n'ont pas été en mesure de savoir ce que AUC, en ce qui concerne la prédiction, signifie ou signifie.

228 classification prediction roc auc abbreviation

4

Choix de K dans la validation croisée du pli K

Je me sers de la quelques fois la validation croisée de d'évaluer la performance de certains algorithmes d'apprentissage, mais je l' ai toujours été perplexe quant à la façon dont je choisir la valeur de .KKKKKK J'ai souvent vu et utilisé une valeur de , mais cela me semble totalement …

136 machine-learning classification cross-validation

4

Kappa de Cohen en anglais clair

Je lis un livre de data mining qui mentionnait la statistique Kappa comme moyen d’évaluer les performances de prévision des classificateurs. Cependant, je ne peux tout simplement pas comprendre cela. J'ai aussi vérifié Wikipedia mais cela n'a pas aidé aussi: https://en.wikipedia.org/wiki/Cohen's_kappa . Comment le kappa de Cohen aide-t-il à évaluer …

131 classification data-mining cohens-kappa

5

Comment fonctionne une machine à vecteurs de support (SVM)?

Comment une machine à vecteurs de support (SVM) travail, et ce qui le différencie des autres classificateurs linéaires, tels que le linéaire Perceptron , analyse discriminante linéaire ou régression logistique ? * (* Je pense en termes de motivations sous-jacentes à l'algorithme, de stratégies d'optimisation, de capacités de généralisation et …

109 machine-learning classification svm statistical-learning

7

Pourquoi la précision n'est-elle pas la meilleure mesure pour évaluer les modèles de classification?

C'est une question générale qui a été posée indirectement à plusieurs reprises ici, mais il manque une seule réponse faisant autorité. Il serait bon d'avoir une réponse détaillée à cette question pour la référence. L’exactitude , la proportion de classifications correctes parmi toutes les classifications, est une mesure très simple …

107 machine-learning classification accuracy model-evaluation scoring-rules

3

Comment calculez-vous la précision et le rappel pour la classification multiclass à l'aide de la matrice de confusion?

Je me demande comment calculer la précision et se rappeler en utilisant une matrice de confusion pour un problème de classification multi-classes. Plus précisément, une observation ne peut être affectée qu'à sa classe / étiquette la plus probable. Je voudrais calculer: Précision = TP / (TP + FP) Rappel = …

92 machine-learning classification precision-recall multi-class

5

Comment calculer l'aire sous la courbe (AUC) ou la statistique c à la main

Je suis intéressé par le calcul de l'aire sous la courbe (AUC), ou la statistique C, à la main pour un modèle de régression logistique binaire. Par exemple, dans le jeu de données de validation, j'ai la valeur vraie pour la variable dépendante, rétention (1 = retenue; 0 = non …

78 regression logistic classification roc auc

3

Comment produire un joli graphique des résultats de l'analyse par grappes k-means?

J'utilise R pour faire du clustering K-means. J'utilise 14 variables pour exécuter K-means Quelle est une jolie façon de tracer les résultats de K-means? Y a-t-il des implémentations existantes? Avoir 14 variables complique-t-il la représentation graphique des résultats? J'ai trouvé quelque chose appelé GGcluster qui a l'air cool mais qui …

77 data-visualization classification k-means unsupervised-learning

1

Aidez-moi à comprendre les machines à vecteurs de support

Je comprends les principes de base de l'objectif d'un support vectoriel en termes de classification d'un jeu d'entrées dans plusieurs classes différentes, mais ce que je ne comprends pas, ce sont certains détails de base. Pour commencer, l'utilisation des variables Slack me laisse un peu perplexe. Quel est leur but? …

76 machine-learning classification svm

6

Sélection des fonctionnalités pour le modèle «final» lors de la validation croisée en apprentissage automatique

Je suis un peu confus au sujet de la sélection des fonctionnalités et de l'apprentissage automatique, et je me demandais si vous pouviez m'aider. J'ai un jeu de données de micropuces qui est classé en deux groupes et qui comporte des milliers de fonctionnalités. Mon objectif est d'obtenir un petit …

76 machine-learning classification cross-validation feature-selection genetics

3

Pourquoi la régression logistique n'est-elle pas appelée classification logistique?

Étant donné que la régression logistique est un statistique modèle de classification prises avec des variables dépendantes, pourquoi pas appelé Classification logistique ? Le nom "Régression" ne devrait-il pas être réservé aux modèles traitant des variables dépendantes continues?

75 regression machine-learning logistic classification terminology

3

Quelle est la meilleure façon de présenter une forêt au hasard dans une publication?

J'utilise l'algorithme de forêt aléatoire en tant que classificateur robuste de deux groupes dans une étude de microréseau comportant des milliers d'éléments. Quelle est la meilleure façon de présenter la forêt aléatoire de manière à ce qu'il y ait suffisamment d'informations pour la rendre reproductible dans un document? Existe-t-il une …

75 r machine-learning classification random-forest microarray

4

Pourquoi les réseaux de neurones deviennent-ils plus profonds, mais pas plus larges?

Au cours des dernières années, les réseaux de neurones convolutionnels (ou peut-être les réseaux de neurones profonds en général) sont devenus de plus en plus profonds, avec des réseaux à la pointe de la technologie allant de 7 couches ( AlexNet ) à 1 000 couches ( réseaux résiduels) en …

73 machine-learning classification neural-networks deep-learning conv-neural-network

8

Comment calculer la précision / rappel pour la classification multiclass-multilabel?

Je me demande comment calculer les mesures de précision et de rappel pour la classification multiclass à étiquettes multiples, c'est-à-dire une classification dans laquelle il existe plus de deux étiquettes et où chaque instance peut avoir plusieurs étiquettes?

72 machine-learning classification precision-recall multi-class

4

Comment tracer les courbes ROC dans la classification multiclass?

En d’autres termes, au lieu d’avoir un problème à deux classes, j’ai plutôt affaire à quatre classes et j’aimerais toujours évaluer les performances en utilisant l’ASC.

66 classification roc

Questions marquées «classification»