Questions marquées «model-selection»

La sélection des modèles est un problème pour juger quel modèle d'un ensemble donne les meilleurs résultats. Les méthodes populaires incluentR2, Critères AIC et BIC, ensembles de tests et validation croisée. Dans une certaine mesure, la sélection des fonctionnalités est un sous-problème de la sélection des modèles.



3
Comment savoir que votre problème d'apprentissage automatique est sans espoir?
Imaginez un scénario d’apprentissage automatique standard: Vous êtes confronté à un vaste ensemble de données multivariées et vous en avez une compréhension assez floue. Ce que vous devez faire est de faire des prédictions sur certaines variables en fonction de ce que vous avez. Comme d'habitude, vous nettoyez les données, …




2
Que savons-nous du piratage informatique «à l'état sauvage»?
La phrase p- achalandage (aussi: "dragage de données" , "espionnage" ou "pêche") fait référence à divers types de fautes statistiques dans lesquelles les résultats deviennent artificiellement statistiquement significatifs. Il existe de nombreuses façons d'obtenir un résultat "plus significatif", notamment, sans s'y limiter: analyser uniquement un sous-ensemble "intéressant" de données dans …


14
Pourquoi les statistiques robustes (et résistantes) n'ont-elles pas remplacé les techniques classiques?
Lors de la résolution de problèmes métiers à l'aide de données, il est courant qu'au moins une hypothèse clé selon laquelle les statistiques classiques sous-goupilles sont invalides est invalide. La plupart du temps, personne ne se soucie de vérifier ces hypothèses pour ne jamais le savoir. Par exemple, le fait …

5
Quelles sont les alternatives modernes et facilement utilisables à la régression pas à pas?
J'ai un ensemble de données avec environ 30 variables indépendantes et j'aimerais construire un modèle linéaire généralisé (GLM) pour explorer la relation entre elles et la variable dépendante. Je suis conscient que la méthode qui m'a été enseignée pour cette situation, la régression par étapes, est maintenant considérée comme un …

6
La sélection de variables pour la modélisation prédictive est-elle vraiment nécessaire en 2016?
Cette question a été posée sur CV il y a quelques années. Cela semble mériter d'être republié compte tenu des technologies informatiques les plus performantes (par exemple, calcul parallèle, calcul haute performance, etc.) et de nouvelles techniques, par exemple [3]. Tout d'abord, un peu de contexte. Supposons que l'objectif ne …


2
Une discussion plus définitive sur la sélection de variables
Contexte Je fais de la recherche clinique en médecine et j'ai suivi plusieurs cours de statistiques. Je n'ai jamais publié d'article sur la régression linéaire / logistique et souhaiterais effectuer une sélection de variables correctement. L’interprétabilité est importante, donc pas de techniques d’apprentissage automatique sophistiquées. J'ai résumé ma compréhension de …


3
Modèle linéaire à réponse logarithmique vs modèle linéaire généralisé à liaison logarithmique
Dans cet article intitulé "CHOISIR ENTRE DES MODÈLES LINÉAIRES GÉNÉRALISÉS APPLIQUÉS AUX DONNÉES MÉDICALES", les auteurs écrivent: Dans un modèle linéaire généralisé, la moyenne est transformée, par la fonction de lien, au lieu de transformer la réponse elle-même. Les deux méthodes de transformation peuvent conduire à des résultats très différents. …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.