Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées










3
Langage naturel vers requête SQL
J'ai travaillé sur le développement d'un système "Conversion du langage naturel en requête SQL". J'ai lu les réponses aux questions similaires, mais je n'ai pas pu obtenir les informations que je cherchais. Voici l'organigramme d'un tel système que j'ai obtenu d' un algorithme pour transformer le langage naturel en requêtes …

2
Comment appliquez-vous SMOTE sur la classification de texte?
La technique de suréchantillonnage des minorités synthétiques (SMOTE) est une technique de suréchantillonnage utilisée dans un problème de jeu de données déséquilibré. Jusqu'à présent, j'ai une idée de comment l'appliquer sur des données génériques et structurées. Mais est-il possible de l'appliquer sur un problème de classification de texte? De quelle …

4
Une alternative d'encodage à chaud pour les grandes valeurs catégorielles?
Bonjour, j'ai une trame de données avec de grandes valeurs catégorielles sur 1600 catégories. Est-ce que je peux trouver des alternatives pour ne pas avoir plus de 1600 colonnes. J'ai trouvé ce lien intéressant ci-dessous http://amunategui.github.io/feature-hashing/#sourcecode Mais ils se convertissent en classe / objet dont je ne veux pas. Je …



4
Dimensionnalité et collecteur
Une phrase couramment entendue dans le Machine Learning non supervisé est Les entrées de grande dimension vivent généralement sur ou à proximité d'un collecteur de faible dimension Qu'est-ce qu'une dimension? Qu'est-ce qu'un collecteur? Quelle est la différence? Pouvez-vous donner un exemple pour décrire les deux? Collecteur de Wikipedia: En mathématiques, …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.