Questions marquées «validation»

Processus d'évaluation de la probabilité que les résultats d'une analyse se maintiennent en dehors du cadre de recherche d'origine. N'UTILISEZ PAS cette balise pour discuter de la «validité» d'une mesure ou d'un instrument (comme le fait qu'elle mesure ce qu'elle prétend), utilisez plutôt la balise [validité].

2
Scikit bonne façon d'étalonner les classificateurs avec CalibratedClassifierCV
Scikit a CalibratedClassifierCV , qui nous permet d'étalonner nos modèles sur une paire X, y particulière. Il indique également clairement quedata for fitting the classifier and for calibrating it must be disjoint. S'ils doivent être disjoints, est-il légitime de former le classificateur avec les éléments suivants? model = CalibratedClassifierCV(my_classifier) model.fit(X_train, …

1
Lors de la construction d'un modèle de régression à l'aide d'ensembles de modélisation / validation distincts, est-il approprié de «recirculer» les données de validation?
Supposons que j'ai un partage 80/20 entre les observations de modélisation / validation. J'ai ajusté un modèle à l'ensemble de données de modélisation et je suis à l'aise avec l'erreur que je vois sur l'ensemble de données de validation. Avant de déployer mon modèle pour noter les observations futures, est-il …

3
Pourquoi la méthode d'exclusion (fractionnement des données en formation et tests) n'est-elle pas utilisée dans les statistiques classiques?
Dans mon exposition en classe à l'exploration de données, la méthode de rétention a été introduite comme moyen d'évaluer les performances du modèle. Cependant, lorsque j'ai suivi mon premier cours sur les modèles linéaires, cela n'a pas été introduit comme moyen de validation ou d'évaluation des modèles. Ma recherche en …

1
Nom de l'erreur moyenne absolue analogue au score de Brier?
La question d'hier Déterminer l'exactitude du modèle qui estime la probabilité d'un événement m'a rendu curieux au sujet de la notation des probabilités. Le score de Brier est une mesure d'erreur quadratique moyenne. Est-ce que l'analogue signifie une mesure absolue des performances d'erreur absolue avoir un nom aussi?1N∑i=1N(predictioni−referencei)21N∑i=1N(predictioni−referencei)2\frac{1}{N}\sum\limits _{i=1}^{N}(prediction_i - …




3
Qu'est-ce qu'un contrôle de cohérence?
On m'a posé une question telle que "Avez-vous effectué un contrôle de cohérence dans votre travail quotidien?" lors d'un entretien téléphonique pour un poste de biostatisticien. Je ne sais pas quoi répondre. Toute information est appréciée.
11 validation 


2
Comment créer un ensemble d'échantillons représentatif à partir d'un grand ensemble de données global?
Quelles sont les techniques statistiques pour créer un ensemble d'échantillons représentatif de l'ensemble de la population (avec un niveau de confiance connu)? Aussi, Comment valider, si l'échantillon correspond à l'ensemble de données global? Est-ce possible, sans analyser l'ensemble de données entier (qui pourrait être des milliards d'enregistrements)?

2
Biais d'optimisme - estimations de l'erreur de prédiction
Le livre Elements of Statistical Learning (disponible en ligne en PDF) discute du biais d'optimisim (7.21, page 229). Il indique que le biais d'optimisme est la différence entre l'erreur d'apprentissage et l'erreur dans l'échantillon (erreur observée si nous échantillonnons de nouvelles valeurs de résultat à chacun des points d'apprentissage d'origine) …





En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.