le processus d'utilisation de la connaissance du domaine des données pour créer des fonctionnalités qui améliorent les algorithmes d'apprentissage automatique
Je construis des modèles avec des données catégoriques depuis un certain temps et lorsque, dans cette situation, je par défaut utilise par défaut la fonction LabelEncoder de scikit-learn pour transformer ces données avant de créer un modèle. Je comprends la différence entre OHE, LabelEncoderet DictVectorizoren termes de ce qu'ils font …
Est-il préférable d'encoder des fonctionnalités comme le mois et l'heure en tant que facteur ou numérique dans un modèle d'apprentissage automatique? D'une part, je pense que l'encodage numérique pourrait être raisonnable, car le temps est un processus progressif (le cinquième mois est suivi du sixième mois), mais d'autre part, je …
J'essaie de comprendre comment je peux coder des variables catégorielles en utilisant une estimation de vraisemblance, mais j'ai eu peu de succès jusqu'à présent. Toutes les suggestions seraient grandement appréciées.
Dans le cas d'une combinaison d'attributs catégoriels et numériques, je convertis généralement les attributs catégoriels en un seul vecteur chaud. Ma question est la suivante: dois-je laisser ces vecteurs tels quels et mettre à l'échelle les attributs numériques par le biais de la normalisation / normalisation, ou dois-je mettre à …
Je participe à un concours de kaggle. L'ensemble de données comprend environ 100 fonctionnalités et toutes sont inconnues (en termes de ce qu'elles représentent réellement). Fondamentalement, ce ne sont que des chiffres. Les gens effectuent beaucoup d'ingénierie des fonctionnalités sur ces fonctionnalités. Je me demande comment exactement on est capable …
Fermé . Cette question a besoin de détails ou de clarté . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Ajoutez des détails et clarifiez le problème en modifiant ce message . Fermé il y a 3 ans . Je travaille sur un jeu de données fictif avec …
Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen …
Je passais par une solution de la concurrence des prix du logement sur Kaggle ( noyau analogique humain sur les prix des logements : techniques de régression avancées ) et suis tombé sur cette partie: # Transform the skewed numeric features by taking log(feature + 1). # This will make …
Je lis une présentation et il recommande de ne pas utiliser l'encodage de sortie, mais il est correct avec un encodage à chaud. Je pensais qu'ils étaient tous les deux identiques. Quelqu'un peut-il décrire les différences entre eux?
J'ai une question pratique sur l'ingénierie des fonctionnalités ... disons que je veux prédire les prix des logements en utilisant la régression logistique et en utilisant un tas de fonctionnalités, y compris le code postal. Ensuite, en vérifiant l'importance des fonctionnalités, je me rends compte que le zip est une …
Je lisais le matériel lié à XGBoost. Il semble que cette méthode ne nécessite aucune mise à l'échelle variable car elle est basée sur des arbres et celle-ci peut capturer des interactions complexes de modèle de non-linéarité. Et il peut gérer à la fois des variables numériques et catégorielles et …
Existe-t-il une ressource avec une liste de techniques d'ingénierie des fonctionnalités? Une cartographie du type de données, du modèle et de la technique d'ingénierie des caractéristiques serait une mine d'or
J'ai les données suivantes pour un petit projet parallèle. Cela vient d'un accéléromètre posé sur une laveuse / sécheuse et j'aimerais qu'il me dise quand la machine est terminée. x est les données d'entrée (mouvement x / y / z comme une valeur), y est l'étiquette activée / désactivée Parce …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.