Je fais face à un problème où je n'ai pas pu trouver suffisamment de jeux de données (images) pour alimenter mon réseau neuronal profond pour l'entraînement. J'ai été tellement inspiré par l'article Generative Adversarial Text to Image Synthesis publié par Scott Reed et al. sur les réseaux contradictoires génératifs. J'étais …
J'utilise Python pour exécuter un modèle de forêt aléatoire sur mon jeu de données déséquilibré (la variable cible était une classe binaire). Lors du fractionnement de l'ensemble de données de formation et de test, j'ai eu du mal à utiliser un échantillonnage stratifié (comme le code illustré) ou non. Jusqu'à …
Il semble être devenu axiomatique qu'un ensemble d'apprenants aboutisse aux meilleurs résultats de modèles possibles - et il devient de plus en plus rare, par exemple, que des modèles uniques gagnent des compétitions telles que Kaggle. Y a-t-il une explication théorique pour expliquer pourquoi les ensembles sont si efficaces?
Je voudrais savoir comment faire correspondre les adresses postales lorsque leur format diffère ou lorsque l'une d'elles est mal orthographiée. Jusqu'à présent, j'ai trouvé différentes solutions mais je pense qu'elles sont assez anciennes et peu efficaces. Je suis sûr qu'il existe de meilleures méthodes, donc si vous avez des références …
Je comprends d'après l'article de Hinton que le T-SNE fait un bon travail en gardant les similitudes locales et un travail décent en préservant la structure mondiale (clusterisation). Cependant, je ne sais pas si les points apparaissant plus proches dans une visualisation 2D t-sne peuvent être supposés comme des points …
Je travaille sur un problème de classification. J'ai un ensemble de données contenant un nombre égal de variables catégorielles et de variables continues. Comment saurai-je quelle technique utiliser? entre un arbre de décision et une régression logistique? Est-il juste de supposer que la régression logistique sera plus appropriée pour la …
J'ai un ensemble de données d'utilisateurs qui achètent des produits sur un site Web. Les attributs que j'ai sont l'ID utilisateur, la région (état) de l'utilisateur, l'ID catégories du produit, l'ID mots clés du produit, l'ID mots clés du site Web et le montant des ventes dépensées pour le produit. …
Je cherche à regrouper k-means sur un ensemble de points à 10 dimensions. Le hic: il y a 10 ^ 10 points . Je recherche juste le centre et la taille des plus grands clusters (disons 10 à 100 clusters); Je me fiche du cluster dans lequel se trouve chaque …
Existe-t-il des bibliothèques d'apprentissage automatique pour Ruby qui sont relativement complètes (y compris une grande variété d'algorithmes pour l'apprentissage supervisé et non supervisé), testées de manière robuste et bien documentées? J'adore scikit-learn de Python pour sa documentation incroyable, mais un client préfère écrire le code dans Ruby car c'est ce …
J'ai un ensemble de données avec les spécifications suivantes: Ensemble de données d'apprentissage avec 193 176 échantillons avec 2 821 positifs Ensemble de données de test avec 82 887 échantillons avec 673 positifs Il y a 10 fonctionnalités. Je souhaite effectuer une classification binaire (0 ou 1). Le problème auquel …
J'ai un ensemble de données binaires très biaisé - j'ai 1000 fois plus d'exemples de la classe négative que de la classe positive. J'aimerais former un ensemble d'arbres (comme des arbres aléatoires supplémentaires ou une forêt aléatoire) sur ces données, mais il est difficile de créer des ensembles de données …
J'essaie de comprendre comment tous les composants "big data" jouent ensemble dans un cas d'utilisation réel, par exemple hadoop, monogodb / nosql, storm, kafka, ... Je sais que c'est une gamme assez large d'outils utilisés pour différents types, mais j'aimerais en savoir plus sur leur interaction dans les applications, par …
Pour les réseaux de neurones, nous avons le théorème d'approximation universel qui stipule que les réseaux de neurones peuvent approximer n'importe quelle fonction continue sur un sous-ensemble compact deRnRnR^n. Existe-t-il un résultat similaire pour les arbres à gradient amélioré? Cela semble raisonnable car vous pouvez continuer à ajouter plus de …
J'entraîne un réseau neuronal convolutionnel pour classer les images sur les conditions de brouillard (3 classes). Cependant, pour chacune des 150 000 images environ, j'ai également quatre variables météorologiques disponibles qui pourraient aider à prévoir les classes d'images. Je me demandais comment je pourrais ajouter les variables météorologiques (par exemple …
Si je regarde l'une des nombreuses sources des classes Imagenet sur Internet, je ne trouve pas une seule classe liée aux êtres humains (et non, moissonneur n'est pas quelqu'un qui récolte, mais c'est ce que je savais en tant que papa pattes longues, une sorte de Araign? e :-). Comment …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.