Question très intéressante (+1). Bien que je ne connaisse aucun outil logiciel qui offre actuellement des fonctionnalités complètes pour l' ingénierie des fonctionnalités , il existe certainement un large éventail d'options à cet égard. Actuellement, pour autant que je sache, l'ingénierie des fonctionnalités est encore en grande partie un processus laborieux et manuel (c.-à-d., Voir cet article de blog ). Parlant du domaine de l'ingénierie des fonctionnalités, cet excellent article de Jason Brownlee fournit un aperçu assez complet du sujet.
Ben Lorica, chef scientifique des données et directeur de la stratégie de contenu pour les données chez O'Reilly Media Inc., a écrit un très bel article , décrivant l'état de l'art (en juin 2014) les approches, méthodes, outils et startups dans le domaine de l' automatisation (ou, comme il le dit, la rationalisation ) de l'ingénierie des fonctionnalités.
J'ai jeté un bref coup d'œil à certaines startups auxquelles Ben a fait référence et un produit de Skytree semble en effet assez impressionnant, en particulier en ce qui concerne le sujet de cette question. Cela dit, certaines de leurs affirmations me semblent vraiment suspectes (c.-à-d. «Skytree accélère les méthodes d'apprentissage automatique jusqu'à 150 fois par rapport aux options open source» ). En continuant à parler des offres commerciales de science des données et d'apprentissage automatique, je dois mentionner les solutions de Microsoft, en particulier leur Azure Machine Learning Studio . Ce produit basé sur le Web est assez puissant et élégant et offre des fonctionnalités d'ingénierie des fonctionnalités (FEF). Pour un exemple de FEF simple, voir cette belle vidéo .
Pour revenir à la question, je pense que l'approche la plus simple que l'on puisse appliquer pour automatiser l'ingénierie des fonctionnalités consiste à utiliser les IDE correspondants . Puisque vous (moi aussi) êtes intéressé par le langage R en tant que backend de science des données, je suggère de vérifier, en plus de RStudio, un autre IDE open source similaire, appelé RKWard . L'un des avantages de RKWard vs RStudio est qu'il prend en charge l' écriture de plugins pour l'IDE, permettant ainsi aux scientifiques des données d'automatiser l'ingénierie des fonctionnalités et de rationaliser leur analyse des données basée sur R.
Enfin, de l'autre côté du spectre des solutions d'ingénierie des fonctionnalités, nous pouvons trouver des projets de recherche . Les deux plus notables semblent être le projet Columbus de l'Université de Stanford , décrit en détail dans le document de recherche correspondant , et Brainwash , décrit dans ce document .