Packages de sélection de fonctionnalités dans R, qui effectuent à la fois la régression et la classification


12

Je suis très nouveau à R. J'apprends l'apprentissage automatique en ce moment. Désolé, si cette question semble très basique. J'essaie de trouver un bon package de sélection de fonctionnalités dans R. J'ai parcouru le package Boruta. C'est un bon paquet mais j'ai lu qu'il n'est utile que pour la classification.

Je veux implémenter la sélection de fonctionnalités dans R pour les tâches de régression. J'ai parcouru la documentation du package caret mais pour mon niveau, c'est très difficile à comprendre.

Quelqu'un peut-il me diriger vers un bon didacticiel ou répertorier les bons packages ou les packages les plus fréquemment utilisés dans R pour la sélection des fonctionnalités.

Toute aide serait appréciée. Merci d'avance.


3
Boruta fonctionne bien pour la régression.

Réponses:


13

Vous pouvez également consulter FSelector , varSelRF . FSelector contient plusieurs fonctions pour la sélection de fonctionnalités basées par exemple sur le test du chi carré, sur la théorie de l'information (entropie, information mutuelle, rapport de gain, ...), sur la corrélation entre fonctionnalité, cohérence etc ... varSelRF est un package utile pour la sélection des caractéristiques en utilisant des forêts aléatoires avec élimination variable en arrière et avec un spectre d'importance.


2
Salut FWaldner, cela semble un peu court pour une réponse. Pourriez-vous envisager de l'étendre peut-être d'une ou deux phrases, peut-être pour mentionner brièvement ce que font ces paquets qui sont semblables ou non aux autres suggestions, ou même peut-être contre d'autres choses? Dans l'état actuel des choses, c'est simplement une paire de liens.
Glen_b -Reinstate Monica

Il semble que varSelRF vise également uniquement la classification des forêts aléatoires plutôt que la régression.
blmoore


3

Je suggère Rattle qui a une sélection aléatoire de caractéristiques de la forêt (et bien plus encore). Il a une belle interface graphique et très facile à utiliser.


1

GLMNET avec régression au lasso ne sélectionne les fonctionnalités.


1
Pouvez-vous fournir une réponse détaillée?
Apprenti

1

De plus, le Caretpackage fournit également des méthodes de sélection des fonctionnalités. Voici et voici quelques tutoriels sur l'utilisation de la sélection des fonctionnalités dans Caret package. Récemment, un package de sélection de fonctionnalités basé sur l'algorithme SISAL de Tikka et Hollmén est disponible dans le CRAN .


Le lien vers le didacticiel est mort. Cependant, ce lien pourrait être utile.
Ekaba Bisong
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.