Cette question concerne l'estimation des scores de coupure sur un questionnaire de dépistage multidimensionnel pour prédire un critère d'évaluation binaire, en présence d'échelles corrélées. On m'a interrogé sur l'intérêt de contrôler les sous-scores associés lors de l'élaboration des scores de coupure sur chaque dimension d'une échelle de mesure (traits de …
Quelqu'un peut-il m'expliquer la ou les réelles différences entre l'analyse de régression et l'ajustement de courbe (linéaire et non linéaire), avec un exemple si possible? Il semble que les deux tentent de trouver une relation entre deux variables (dépendantes ou indépendantes) puis déterminent le paramètre (ou coefficient) associé aux modèles …
Je viens de terminer la lecture de cette discussion. Ils soutiennent que PR AUC est meilleure que ROC AUC sur un ensemble de données déséquilibré. Par exemple, nous avons 10 échantillons dans l'ensemble de données de test. 9 échantillons sont positifs et 1 négatif. Nous avons un modèle terrible qui …
Une règle de notation appropriée est une règle qui est maximisée par un `` vrai '' modèle et qui ne permet pas de `` couvrir '' ou de jouer le système (rapportant délibérément des résultats différents, comme le croit réellement le modèle pour améliorer le score). Le score Brier est …
J'ai quelques doutes quant à la mesure de performance à utiliser, l'aire sous la courbe ROC (TPR en fonction de FPR) ou l'aire sous la courbe de précision-rappel (précision en fonction du rappel). Mes données sont déséquilibrées, c'est-à-dire que le nombre d'instances négatives est beaucoup plus important que les instances …
J'ai construit une courbe ROC pour un système de diagnostic. L'aire sous la courbe a ensuite été estimée de manière non paramétrique à AUC = 0,89. Lorsque j'ai essayé de calculer la précision au réglage de seuil optimal (le point le plus proche du point (0, 1)), j'ai obtenu la …
J'expérimente l'algorithme de la machine de renforcement de gradient via le caretpackage en R. À l'aide d'un petit ensemble de données d'admission à l'université, j'ai exécuté le code suivant: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
J'étudie un cours d'apprentissage automatique et les diapositives de la conférence contiennent des informations que je trouve en contradiction avec le livre recommandé. Le problème est le suivant: il existe trois classificateurs: classificateur A offrant de meilleures performances dans la plage inférieure des seuils, classificateur B offrant de meilleures performances …
Supposons que j'ai construit un modèle de prédiction pour l'occurrence d'une maladie particulière dans un jeu de données (le jeu de données de construction du modèle) et que je souhaite maintenant vérifier l'efficacité du modèle dans un nouveau jeu de données (le jeu de données de validation). Pour un modèle …
Quels sont les avantages des courbes ROC? Par exemple, je classe certaines images, ce qui est un problème de classification binaire. J'ai extrait environ 500 fonctionnalités et appliqué un algorithme de sélection de fonctionnalités pour sélectionner un ensemble de fonctionnalités, puis j'ai appliqué SVM pour la classification. Dans ce cas, …
Je prévois d'utiliser une validation croisée stratifiée répétée (10 fois) sur environ 10 000 cas en utilisant un algorithme d'apprentissage automatique. Chaque fois, la répétition sera effectuée avec différentes graines aléatoires. Dans ce processus, je crée 10 instances d'estimations de probabilité pour chaque cas. 1 instance d'estimation de probabilité pour …
J'ai un ensemble de tests de 100 cas et deux classificateurs. J'ai généré des prédictions et calculé l'ASC ROC, la sensibilité et la spécificité pour les deux classificateurs. Question 1: Comment puis-je calculer la valeur de p pour vérifier si l'un est significativement meilleur que l'autre en ce qui concerne …
J'ai appliqué une régression logistique à mes données sur SAS et voici la courbe ROC et le tableau de classification. Je suis à l'aise avec les chiffres du tableau de classification, mais je ne sais pas exactement ce que la courbe roc et la zone en dessous montrent. Toute explication …
J'essaie de comprendre comment calculer le point de coupure optimal pour une courbe ROC (la valeur à laquelle la sensibilité et la spécificité sont maximisées). J'utilise l'ensemble aSAHde données du package pROC. La outcomevariable pourrait s'expliquer par deux variables indépendantes: s100bet ndka. En utilisant la syntaxe du Epipackage, j'ai créé …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.