Statistiques et Big Data feature-selection

1

Pointe et dalle bayésienne versus méthodes pénalisées

Je lis les diapositives de Steven Scott sur le package BSTS R (vous pouvez les trouver ici: diapositives ). À un moment donné, lorsqu'il parle d'inclure de nombreux régresseurs dans le modèle de série chronologique structurelle, il présente les a priori de pointe et de dalle des coefficients de régression …

11 r bayesian feature-selection penalized bsts

1

Comment interpréter les résultats lorsque la crête et le lasso fonctionnent bien séparément mais produisent des coefficients différents

J'utilise un modèle de régression avec Lasso et Ridge (pour prédire une variable de résultat discrète allant de 0 à 5). Avant d'exécuter le modèle, j'utilise la SelectKBestméthode de scikit-learnpour réduire l'ensemble de fonctionnalités de 250 à 25 . Sans sélection initiale des caractéristiques, Lasso et Ridge cèdent tous deux …

11 regression predictive-models feature-selection lasso ridge-regression

2

Pourquoi la régression des crêtes ne peut-elle pas offrir une meilleure interprétabilité que LASSO?

J'ai déjà une idée des avantages et des inconvénients de la régression des crêtes et du LASSO. Pour le LASSO, le terme de pénalité L1 donnera un vecteur de coefficient clairsemé, qui peut être considéré comme une méthode de sélection de caractéristiques. Cependant, il existe certaines limitations pour le LASSO. …

11 feature-selection lasso regularization ridge-regression elastic-net

1

Pourquoi la sélection des fonctionnalités est-elle importante pour les tâches de classification?

J'apprends la sélection des fonctionnalités. Je vois pourquoi ce serait important et utile pour la construction de modèles. Mais concentrons-nous sur les tâches d'apprentissage supervisé (classification). Pourquoi la sélection des fonctionnalités est-elle importante pour les tâches de classification? Je vois beaucoup de littérature écrite sur la sélection des fonctionnalités et …

11 feature-selection accuracy regression-strategies

1

Pour quel type de sélection de fonctionnalités le test du chi carré peut-il être utilisé?

Ici, je demande ce que les autres font couramment pour utiliser le test du chi carré pour la sélection des fonctionnalités par rapport au résultat de l'apprentissage supervisé. Si je comprends bien, testent-ils l'indépendance entre chaque fonctionnalité et le résultat, et comparent-ils les valeurs de p entre les tests pour …

11 hypothesis-testing chi-squared feature-selection independence scikit-learn

6

Méthodes en R ou Python pour effectuer la sélection des fonctionnalités dans un apprentissage non supervisé [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . Quelles sont les méthodes / implémentations disponibles dans R / Python …

11 r feature-selection python

2

Mesures de la séparabilité des classes dans les problèmes de classification

Un exemple d'une bonne mesure de la séparabilité des classes chez les apprenants discriminants linéaires est le rapport discriminant linéaire de Fisher. Existe-t-il d'autres mesures utiles pour déterminer si les ensembles de fonctionnalités offrent une bonne séparation des classes entre les variables cibles? En particulier, je suis intéressé à trouver …

11 machine-learning classification feature-selection discriminant-analysis

1

Sélection automatique des fonctionnalités pour la détection des anomalies

Quelle est la meilleure façon de sélectionner automatiquement les fonctionnalités pour la détection des anomalies? Je traite normalement la détection d'anomalies comme un algorithme où les fonctionnalités sont sélectionnées par des experts humains: ce qui compte, c'est la plage de sortie (comme dans "entrée anormale - sortie anormale"), donc même …

11 feature-selection outliers

1

R / mgcv: Pourquoi les produits tenseurs te () et ti () produisent-ils des surfaces différentes?

Le mgcvpackage pour Ra deux fonctions pour ajuster les interactions des produits tensoriels: te()et ti(). Je comprends la division de base du travail entre les deux (ajustement d'une interaction non linéaire vs décomposition de cette interaction en effets principaux et interaction). Ce que je ne comprends pas, c'est pourquoi te(x1, …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

2

Seuils doux contre pénalisation Lasso

J'essaie de résumer ce que j'ai compris jusqu'à présent dans l'analyse multivariée pénalisée avec des ensembles de données de grande dimension, et j'ai toujours du mal à obtenir une définition correcte du seuillage progressif par rapport à la pénalisation Lasso (ou ).L1L1L_1 Plus précisément, j'ai utilisé une régression PLS clairsemée …

11 multivariate-analysis lasso feature-selection genetics

3

Quels sont les avantages de la régression pas à pas?

J'expérimente la régression pas à pas pour des raisons de diversité dans mon approche du problème. Donc, j'ai 2 questions: Quels sont les avantages de la régression pas à pas? Quelles sont ses forces spécifiques? Que pensez-vous de l'approche hybride, où vous utilisez la régression pas à pas pour sélectionner …

11 regression feature-selection stepwise-regression

1

Est-il judicieux d'utiliser la sélection d'entités avant Random Forest?

Tout est dans le titre, est-il judicieux d'utiliser la sélection des fonctionnalités avant d'utiliser la forêt aléatoire?

11 machine-learning feature-selection random-forest

2

Utilisation de LASSO uniquement pour la sélection des fonctionnalités

Dans ma classe d'apprentissage automatique, nous avons appris comment la régression LASSO est très efficace pour effectuer la sélection de fonctionnalités, car elle utilise la régularisation .l1l1l_1 Ma question: les gens utilisent-ils normalement le modèle LASSO uniquement pour faire la sélection des fonctionnalités (puis procèdent-ils au vidage de ces fonctionnalités …

10 feature-selection lasso regression-strategies

3

Fonctionnalités de classement dans la régression logistique

J'ai utilisé la régression logistique. J'ai six fonctionnalités, je veux connaître les fonctionnalités importantes de ce classificateur qui influencent le résultat plus que d'autres fonctionnalités. J'ai utilisé Information Gain mais il semble que cela ne dépende pas du classificateur utilisé. Existe-t-il une méthode pour classer les entités en fonction de …

10 logistic feature-selection ranking regression-strategies

2

Détection d'anomalies: quel algorithme utiliser?

Contexte: Je développe un système qui analyse les données cliniques pour filtrer les données invraisemblables qui pourraient être des fautes de frappe. Ce que j'ai fait jusqu'à présent: Pour quantifier la plausibilité, ma tentative jusqu'à présent était de normaliser les données, puis de calculer une valeur de plausibilité pour le …

10 machine-learning multivariate-analysis feature-selection algorithms outliers

Questions marquées «feature-selection»