Questions marquées «classification»

La classification statistique est le problème de l'identification de la sous-population à laquelle appartiennent de nouvelles observations, où l'identité de la sous-population est inconnue, sur la base d'un ensemble d'apprentissage de données contenant des observations dont la sous-population est connue. Ces classifications montreront donc un comportement variable qui peut être étudié par des statistiques.

1
Sur la corrélation cophénétique pour le regroupement des dendrogrammes
Considérez le contexte d'un regroupement de dendrogrammes. Appelons dissemblances originales les distances entre les individus. Après avoir construit le dendrogramme, nous définissons la dissimilarité cophénétique entre deux individus comme la distance entre les grappes auxquelles ces individus appartiennent. Certaines personnes considèrent que la corrélation entre les dissemblances originales et les …

3
Comment comparer l'exactitude de deux modèles différents en utilisant la signification statistique
Je travaille sur la prédiction de séries chronologiques. J'ai deux ensembles de données et . J'ai trois modèles de prédiction: . Tous ces modèles sont entraînés à l'aide d'échantillons dans l'ensemble de données , et leurs performances sont mesurées à l'aide des échantillons dans l'ensemble de données . Disons que …


1
Les MFCC sont-ils la méthode optimale pour représenter la musique dans un système de récupération?
Une technique de traitement du signal, la fréquence de Mel Cepstrum , est souvent utilisée pour extraire des informations d'une pièce musicale pour une utilisation dans une tâche d'apprentissage automatique. Cette méthode donne un spectre de puissance à court terme et les coefficients sont utilisés en entrée. Lors de la …

4
Amélioration de la classification SVM du diabète
432607 × 136432607×136432607 \times 136Y11 %11%11\%N89 %89%89\% J'utilise uniquement 15des 136variables indépendantes de l'ensemble de données. L'une des raisons de la réduction de l'ensemble de données était d'avoir plus d'échantillons d'apprentissage lorsque les lignes contenant NAs sont omises. Ces 15variables ont été sélectionnées après l'exécution de méthodes statistiques telles que …



3
Comment classer un ensemble de données déséquilibré par Convolutional Neural Networks (CNN)?
J'ai un ensemble de données déséquilibré dans une tâche de classification binaire, où le montant positif contre le montant négatif est de 0,3% contre 99,7%. L'écart entre les positifs et les négatifs est énorme. Lorsque je forme un CNN avec la structure utilisée dans le problème MNIST, le résultat du …

1
Les forêts aléatoires peuvent-elles faire beaucoup mieux que l'erreur de test de 2,8% sur MNIST?
Je n'ai trouvé aucune documentation sur l'application des forêts aléatoires au MNIST, au CIFAR, au STL-10, etc., alors j'ai pensé les essayer moi-même avec le MNIST invariant par permutation . Dans R , j'ai essayé: randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) Cela a fonctionné pendant 2 heures et a obtenu une …





1
Est-il acceptable d'utiliser la fonction de perte d'entropie croisée avec des étiquettes souples?
J'ai un problème de classification où les pixels seront étiquetés avec des étiquettes souples (qui dénotent des probabilités) plutôt qu'avec des étiquettes rigides 0,1. Auparavant, avec un étiquetage dur de 0,1 pixel, la fonction de perte d'entropie croisée (sigmoidCross entropyLossLayer de Caffe) donnait des résultats décents. Est-il acceptable d'utiliser la …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.