Questions marquées «model-selection»

La sélection des modèles est un problème pour juger quel modèle d'un ensemble donne les meilleurs résultats. Les méthodes populaires incluentR2, Critères AIC et BIC, ensembles de tests et validation croisée. Dans une certaine mesure, la sélection des fonctionnalités est un sous-problème de la sélection des modèles.

1
Biais variable omis dans la régression linéaire
J'ai une question philosophique concernant le biais variable omis. Nous avons le modèle de régression typique (modèle de population) où proviennent les échantillons , puis un tas de conditions dans lesquelles les estimations de l'OLS se comportent assez bien.Y=β0+β1X1+...+βnXn+υ,Y=β0+β1X1+...+βnXn+υ, Y= \beta_0 + \beta_1X_1 + ... + \beta_nX_n + \upsilon, (Y,X1,...,Xn)(Y,X1,...,Xn)(Y,X_1,...,X_n) …

3
Puis-je effectuer une recherche exhaustive avec validation croisée pour la sélection des fonctionnalités?
J'ai lu certains articles sur la sélection des fonctionnalités et la validation croisée, mais j'ai encore des questions sur la bonne procédure. Supposons que j'ai un ensemble de données avec 10 fonctionnalités et que je souhaite sélectionner les meilleures fonctionnalités. Supposons également que j'utilise un classificateur de voisin le plus …

1
Intervalles de confiance lors de l'utilisation du théorème de Bayes
Je calcule des probabilités conditionnelles et des intervalles de confiance à 95% associés. Pour bon nombre de mes cas, j'ai un décompte simple des xsuccès des nessais (à partir d'un tableau de contingence), donc je peux utiliser un intervalle de confiance binomial, tel que celui fourni par binom.confint(x, n, method='exact')dans …

1
Comment appelez-vous cette stratégie de sélection dynamique de la taille de l'échantillon?
Imaginez que vous souhaitiez évaluer très rapidement la compressibilité d'un document volumineux. Vous pouvez choisir au hasard une sous-séquence, essayez de la compresser. Cela peut servir de prédiction pour la compressibilité globale du document. Mais quelle doit être la taille de votre échantillon? Nous avons élaboré la stratégie suivante: Choisissez …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.