Questions marquées «feature-selection»

Méthodes et principes de sélection d'un sous-ensemble d'attributs à utiliser dans une modélisation ultérieure


1
Lasso bayésien vs pointe et dalle
Question: Quels sont les avantages / inconvénients d'utiliser l'un avant l'autre pour la sélection des variables? Supposons que j'ai la probabilité: où je peux mettre l' un des prieurs: ou: w i ∼ π δ 0 + ( 1 - π ) N ( 0 , 100 )y∼N(Xw,σ2I)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I)w i ∼ …

3
Pourquoi les réseaux de neurones ont-ils besoin d'une sélection / ingénierie de fonctionnalités?
Particulièrement dans le contexte des compétitions kaggle, j'ai remarqué que la performance du modèle est une question de sélection / ingénierie de fonctionnalités. Bien que je puisse pleinement comprendre pourquoi c'est le cas dans le cas des algorithmes ML plus conventionnels / old-school, je ne vois pas pourquoi ce serait …

3
Comment la sélection des fonctionnalités et l'optimisation des hyperparamètres doivent-elles être ordonnées dans le pipeline d'apprentissage automatique?
Mon objectif est de classer les signaux des capteurs. Le concept de ma solution jusqu'à présent est le suivant: i) fonctionnalités d'ingénierie à partir d'un signal brut ii) sélection des fonctionnalités pertinentes avec ReliefF et une approche de clustering iii) application de NN, Random Forest et SVM Cependant, je suis …

2
Pourquoi la meilleure sélection de sous-ensembles n'est-elle pas favorisée par rapport au lasso?
Je lis sur la meilleure sélection de sous-ensembles dans le livre Elements of statistics learning. Si j'ai 3 prédicteurs , je crée sous-ensembles:x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 Sous-ensemble sans prédicteurs sous-ensemble avec prédicteurx1x1x_1 sous-ensemble avec prédicteurx2x2x_2 sous-ensemble avec prédicteur x3x3x_3 sous-ensemble avec prédicteurs x1,x2x1,x2x_1,x_2 sous-ensemble avec prédicteurs x1,x3x1,x3x_1,x_3 sous-ensemble avec prédicteurs x2,x3x2,x3x_2,x_3 sous-ensemble avec …

2
Approches conflictuelles de la sélection des variables: AIC, valeurs p ou les deux?
D'après ce que je comprends, la sélection de variables basée sur les valeurs de p (au moins dans le contexte de régression) est très imparfaite. Il semble que la sélection de variables basée sur AIC (ou similaire) soit également considérée comme imparfaite par certains, pour des raisons similaires, bien que …



1
Dans Random Forest, pourquoi un sous-ensemble aléatoire d'entités est-il choisi au niveau du nœud plutôt qu'au niveau de l'arbre?
Ma question: Pourquoi la forêt aléatoire considère-t-elle des sous-ensembles aléatoires de fonctionnalités pour la division au niveau du nœud dans chaque arbre plutôt qu'au niveau de l'arbre ? Contexte: Il s'agit d'une question d'histoire. Tin Kam Ho a publié ce document sur la construction de « forêts de décision » …

2
Y a-t-il des circonstances où une régression pas à pas devrait être utilisée?
La régression pas à pas avait été surutilisée dans de nombreux articles biomédicaux dans le passé, mais cela semble s'améliorer avec une meilleure éducation de ses nombreux problèmes. De nombreux critiques plus âgés le demandent cependant. Quelles sont les circonstances dans lesquelles la régression pas à pas a un rôle …




2
Trouver les meilleures fonctionnalités dans les modèles d'interaction
J'ai une liste de protéines avec leurs valeurs caractéristiques. Un exemple de tableau ressemble à ceci: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Les lignes sont des protéines et les colonnes sont des caractéristiques. J'ai également une liste de protéines qui interagissent également; par exemple Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 Problème …

3
Distribution des probabilités de clustering - méthodes et métriques?
J'ai quelques points de données, contenant chacun 5 vecteurs de résultats discrets agglomérés, les résultats de chaque vecteur générés par une distribution différente, (le type spécifique dont je ne suis pas sûr, ma meilleure supposition est Weibull, avec un paramètre de forme variant quelque part autour de l'exponentielle de puissance …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.