Statistiques et Big Data feature-selection

1

Analyse de sensibilité dans les réseaux de neurones profonds

Suite à une question à laquelle on a déjà répondu ( Extraire l'importance du poids à partir d'un réseau à action directe à une couche ), je recherche des informations sur la pertinence des entrées dans les réseaux de neurones. Considérant un réseau profond, où la reconstruction de l'importance de …

14 neural-networks python feature-selection sensitivity-analysis

1

Lasso bayésien vs pointe et dalle

Question: Quels sont les avantages / inconvénients d'utiliser l'un avant l'autre pour la sélection des variables? Supposons que j'ai la probabilité: où je peux mettre l' un des prieurs: ou: w i ∼ π δ 0 + ( 1 - π ) N ( 0 , 100 )y∼N(Xw,σ2I)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I)w i ∼ …

14 bayesian feature-selection

3

Pourquoi les réseaux de neurones ont-ils besoin d'une sélection / ingénierie de fonctionnalités?

Particulièrement dans le contexte des compétitions kaggle, j'ai remarqué que la performance du modèle est une question de sélection / ingénierie de fonctionnalités. Bien que je puisse pleinement comprendre pourquoi c'est le cas dans le cas des algorithmes ML plus conventionnels / old-school, je ne vois pas pourquoi ce serait …

14 neural-networks deep-learning feature-selection feature-engineering

3

Comment la sélection des fonctionnalités et l'optimisation des hyperparamètres doivent-elles être ordonnées dans le pipeline d'apprentissage automatique?

Mon objectif est de classer les signaux des capteurs. Le concept de ma solution jusqu'à présent est le suivant: i) fonctionnalités d'ingénierie à partir d'un signal brut ii) sélection des fonctionnalités pertinentes avec ReliefF et une approche de clustering iii) application de NN, Random Forest et SVM Cependant, je suis …

14 feature-selection hyperparameter optimization

2

Pourquoi la meilleure sélection de sous-ensembles n'est-elle pas favorisée par rapport au lasso?

Je lis sur la meilleure sélection de sous-ensembles dans le livre Elements of statistics learning. Si j'ai 3 prédicteurs , je crée sous-ensembles:x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 Sous-ensemble sans prédicteurs sous-ensemble avec prédicteurx1x1x_1 sous-ensemble avec prédicteurx2x2x_2 sous-ensemble avec prédicteur x3x3x_3 sous-ensemble avec prédicteurs x1,x2x1,x2x_1,x_2 sous-ensemble avec prédicteurs x1,x3x1,x3x_1,x_3 sous-ensemble avec prédicteurs x2,x3x2,x3x_2,x_3 sous-ensemble avec …

13 regression feature-selection lasso bias-variance-tradeoff

2

Approches conflictuelles de la sélection des variables: AIC, valeurs p ou les deux?

D'après ce que je comprends, la sélection de variables basée sur les valeurs de p (au moins dans le contexte de régression) est très imparfaite. Il semble que la sélection de variables basée sur AIC (ou similaire) soit également considérée comme imparfaite par certains, pour des raisons similaires, bien que …

13 hypothesis-testing multiple-regression feature-selection model-selection aic

2

Quelle est la différence entre la sélection de fonctionnalités et la réduction de dimensionnalité?

Je sais que la sélection des fonctionnalités et la réduction de la dimensionnalité visent à réduire le nombre de fonctionnalités dans l'ensemble de fonctionnalités d'origine. Quelle est la différence exacte entre les deux si nous faisons la même chose dans les deux?

13 machine-learning pca feature-selection dimensionality-reduction

2

Si p> n, le lasso sélectionne au plus n variables

L'une des motivations du filet élastique était la limitation suivante de LASSO: Dans le cas p>np>np > n , le lasso sélectionne au plus n variables avant de saturer, en raison de la nature du problème d'optimisation convexe. Cela semble être une caractéristique limitante pour une méthode de sélection de …

13 regression optimization feature-selection lasso

1

Dans Random Forest, pourquoi un sous-ensemble aléatoire d'entités est-il choisi au niveau du nœud plutôt qu'au niveau de l'arbre?

Ma question: Pourquoi la forêt aléatoire considère-t-elle des sous-ensembles aléatoires de fonctionnalités pour la division au niveau du nœud dans chaque arbre plutôt qu'au niveau de l'arbre ? Contexte: Il s'agit d'une question d'histoire. Tin Kam Ho a publié ce document sur la construction de « forêts de décision » …

13 machine-learning feature-selection random-forest importance history

2

Y a-t-il des circonstances où une régression pas à pas devrait être utilisée?

La régression pas à pas avait été surutilisée dans de nombreux articles biomédicaux dans le passé, mais cela semble s'améliorer avec une meilleure éducation de ses nombreux problèmes. De nombreux critiques plus âgés le demandent cependant. Quelles sont les circonstances dans lesquelles la régression pas à pas a un rôle …

13 regression multiple-regression feature-selection model-selection stepwise-regression

2

Pourquoi utiliser le lasso de groupe au lieu du lasso?

J'ai lu que le lasso de groupe est utilisé pour la sélection des variables et la rareté dans un groupe de variables. Je veux connaître l'intuition derrière cette affirmation. Pourquoi le lasso de groupe est-il préféré au lasso? Pourquoi le chemin de la solution de lasso de groupe n'est-il pas …

13 regression feature-selection lasso regularization

1

Expliquer les étapes de l'algorithme LLE (local linear embedding)?

Je comprends le principe de base derrière l'algorithme pour LLE se compose de trois étapes. Trouver le voisinage de chaque point de données par une métrique telle que k-nn. Trouvez des poids pour chaque voisin qui dénotent l'effet du voisin sur le point de données. Construire l'incorporation de faible dimension …

13 machine-learning model-selection feature-selection dimensionality-reduction nonlinear

2

Quand LASSO sélectionne-t-il des prédicteurs corrélés?

J'utilise le paquet 'lars' dans R avec le code suivant: > library(lars) > set.seed(3) > n <- 1000 > x1 <- rnorm(n) > x2 <- x1+rnorm(n)*0.5 > x3 <- rnorm(n) > x4 <- rnorm(n) > x5 <- rexp(n) > y <- 5*x1 + 4*x2 + 2*x3 + 7*x4 + rnorm(n) …

13 correlation feature-selection lasso regularization ridge-regression

2

Trouver les meilleures fonctionnalités dans les modèles d'interaction

J'ai une liste de protéines avec leurs valeurs caractéristiques. Un exemple de tableau ressemble à ceci: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Les lignes sont des protéines et les colonnes sont des caractéristiques. J'ai également une liste de protéines qui interagissent également; par exemple Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 Problème …

13 machine-learning statistical-significance feature-selection networks

3

Distribution des probabilités de clustering - méthodes et métriques?

J'ai quelques points de données, contenant chacun 5 vecteurs de résultats discrets agglomérés, les résultats de chaque vecteur générés par une distribution différente, (le type spécifique dont je ne suis pas sûr, ma meilleure supposition est Weibull, avec un paramètre de forme variant quelque part autour de l'exponentielle de puissance …

13 distributions clustering feature-selection kolmogorov-smirnov k-means

Questions marquées «feature-selection»