Questions marquées «model-selection»

La sélection des modèles est un problème pour juger quel modèle d'un ensemble donne les meilleurs résultats. Les méthodes populaires incluentR2, Critères AIC et BIC, ensembles de tests et validation croisée. Dans une certaine mesure, la sélection des fonctionnalités est un sous-problème de la sélection des modèles.


6
Comparez le R au carré de deux modèles différents de forêt aléatoire
J'utilise le package randomForest dans R pour développer un modèle de forêt aléatoire pour essayer d'expliquer un résultat continu dans un ensemble de données "large" avec plus de prédicteurs que d'échantillons. Plus précisément, j'adapte un modèle RF permettant à la procédure de sélectionner parmi un ensemble de ~ 75 variables …

2
Existe-t-il une statistique d'ajustement de modèle (comme AIC ou BIC) qui peut être utilisée pour des comparaisons absolues plutôt que simplement relatives?
Je ne connais pas très bien cette littérature, alors pardonnez-moi s'il s'agit d'une question évidente. Étant donné que l'AIC et le BIC dépendent de la maximisation de la probabilité, il semble qu'ils ne peuvent être utilisés que pour effectuer des comparaisons relatives entre un ensemble de modèles tentant de s'adapter …




1
Quel modèle d'apprentissage en profondeur peut classer des catégories qui ne s'excluent pas mutuellement
Exemples: J'ai une phrase dans la description de poste: "Java senior engineer in UK". Je veux utiliser un modèle d'apprentissage profond pour le prédire en 2 catégories: English et IT jobs. Si j'utilise un modèle de classification traditionnel, il ne peut prédire qu'une seule étiquette avec softmaxfonction à la dernière …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Pourquoi le critère d'information ( non ajusté ) est-il utilisé pour sélectionner l'ordre de décalage approprié dans le modèle de série chronologique?
Dans les modèles de séries chronologiques, comme ARMA-GARCH, pour sélectionner le décalage ou l'ordre approprié du modèle, différents critères d'information, comme AIC, BIC, SIC, etc., sont utilisés. Ma question est très simple, pourquoi ne pas utiliser le ajusté pour choisir le modèle approprié? Nous pouvons sélectionner un modèle qui conduit …

4
Interprétation de la valeur AIC
Les valeurs typiques de l'AIC que j'ai vues pour les modèles logistiques sont en milliers, au moins en centaines. par exemple sur http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ l'AIC est 727.39 Bien qu'il soit toujours dit que l'AIC ne devrait être utilisé que pour comparer des modèles, je voulais comprendre ce que signifie une valeur …


1
Quand une règle de notation appropriée est-elle une meilleure estimation de la généralisation dans un cadre de classification?
Une approche typique pour résoudre un problème de classification consiste à identifier une classe de modèles candidats, puis à effectuer une sélection de modèle à l'aide d'une procédure telle que la validation croisée. Généralement, on sélectionne le modèle avec la plus grande précision, ou une fonction associée qui code des …



2
Problème de calcul, d'interprétation des sous-ensembles de regs et questions générales sur la procédure de sélection de modèle
Je souhaite sélectionner des modèles à l'aide de regsubsets(). J'ai une trame de données appelée olympiadaten (données téléchargées: http://www.sendspace.com/file/8e27d0 ). J'attache d'abord ce dataframe puis commence à analyser, mon code est: attach(olympiadaten) library(leaps) a<-regsubsets(Gesamt ~ CommunistSocialist + CountrySize + GNI + Lifeexp + Schoolyears + ExpMilitary + Mortality + PopPoverty …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.