Questions marquées «model-selection»

La sélection des modèles est un problème pour juger quel modèle d'un ensemble donne les meilleurs résultats. Les méthodes populaires incluentR2, Critères AIC et BIC, ensembles de tests et validation croisée. Dans une certaine mesure, la sélection des fonctionnalités est un sous-problème de la sélection des modèles.


3
L'AIC peut-il comparer différents types de modèles?
J'utilise AIC (Akaike's Information Criterion) pour comparer des modèles non linéaires dans R. Est-il valide de comparer les AIC de différents types de modèle? Plus précisément, je compare un modèle ajusté par glm avec un modèle avec un terme à effet aléatoire ajusté par glmer (lme4). Sinon, existe-t-il un moyen …

4
Comment mesurer / classer «l'importance variable» lors de l'utilisation de CART? (en utilisant spécifiquement {rpart} de R)
Lors de la construction d'un modèle CART (spécifiquement l'arbre de classification) à l'aide de rpart (dans R), il est souvent intéressant de savoir quelle est l'importance des différentes variables introduites dans le modèle. Ainsi, ma question est: Quelles sont les mesures communes existantes pour classer / mesurer l'importance des variables …


4
Aborder l'incertitude du modèle
Je me demandais comment les Bayésiens de la communauté CrossValidated perçoivent le problème de l' incertitude du modèle et comment ils préfèrent y faire face? Je vais essayer de poser ma question en deux parties: Dans quelle mesure (selon votre expérience / votre opinion) traite-t-on de l'incertitude du modèle? Je …

5
Quel est l'avantage de traiter un facteur comme aléatoire dans un modèle mixte?
J'ai un problème à accepter les avantages d'étiqueter un facteur de modèle comme aléatoire pour plusieurs raisons. Il me semble que dans presque tous les cas, la solution optimale consiste à traiter tous les facteurs comme fixes. Premièrement, la distinction entre fixe et aléatoire est assez arbitraire. L'explication standard est …




2
Pourquoi l'épreuve de Wilks de 1938 ne fonctionne-t-elle pas pour les modèles mal spécifiés?
Dans le célèbre article de 1938 (« La distribution à grand échantillon du rapport de vraisemblance pour tester les hypothèses composites », Annals of Mathematical Statistics, 9: 60-62), Samuel Wilks a dérivé la distribution asymptotique de 2×LLR2×LLR2 \times LLR (log log vraisemblance ratio ) pour les hypothèses imbriquées, sous l'hypothèse …




2
Meilleure approche pour la sélection de modèles bayésienne ou validation croisée?
Lorsque vous essayez de sélectionner parmi différents modèles ou le nombre de fonctionnalités à inclure, disons la prédiction, je peux penser à deux approches. Divisez les données en ensembles de formation et de test. Mieux encore, utilisez le bootstrapping ou la validation croisée k-fold. Entraînez-vous à chaque fois sur l'ensemble …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.