Plus précisément, ce que je recherche, ce sont des outils avec des fonctionnalités spécifiques à l'ingénierie des fonctionnalités. Je voudrais pouvoir facilement lisser, visualiser, combler les lacunes, etc. Quelque chose de similaire à MS Excel, mais qui a R comme langue sous-jacente au lieu de VB.
Cette question se résume à "comment fonctionnent exactement les couches de convolution . Supposons que j'ai une image en niveaux de gris . L'image a donc un canal. Dans la première couche, j'applique une convolution avec des filtres et un remplissage. Ensuite, j'ai une autre couche de convolution avec convolutions …
J'ai un problème de classification avec environ 1000 échantillons positifs et 10000 négatifs dans l'ensemble de formation. Cet ensemble de données est donc assez déséquilibré. La forêt aléatoire simple tente simplement de marquer tous les échantillons de test comme une classe majoritaire. Voici quelques bonnes réponses sur le sous-échantillonnage et …
J'ai un grand ensemble de données (environ 8 Go). J'aimerais utiliser l'apprentissage automatique pour l'analyser. Donc, je pense que je devrais utiliser SVD puis PCA pour réduire la dimensionnalité des données pour plus d'efficacité. Cependant, MATLAB et Octave ne peuvent pas charger un ensemble de données aussi volumineux. Quels outils …
J'ai vu des discussions sur la «surcharge» d'un GPU, et que pour les «petits» réseaux, il peut en fait être plus rapide de s'entraîner sur un CPU (ou réseau de CPU) qu'un GPU. Qu'entend-on par «petit»? Par exemple, un MLP monocouche avec 100 unités cachées serait-il «petit»? Notre définition de …
Quels sont les principaux avantages du stockage de données dans HDF? Et quelles sont les principales tâches de science des données où HDF est vraiment adapté et utile?
Donc, je commence tout juste à apprendre comment un réseau de neurones peut fonctionner pour reconnaître les modèles et classer les entrées, et j'ai vu comment un réseau de neurones artificiel peut analyser les données d'image et catégoriser les images ( démo avec convnetjs ), et la clé là-bas consiste …
Quand utiliserait-on Random Forestplus SVMet vice versa? Je comprends cela cross-validationet la comparaison de modèles est un aspect important du choix d'un modèle, mais ici j'aimerais en savoir plus sur les règles de base et l'heuristique des deux méthodes. Quelqu'un peut-il expliquer les subtilités, les forces et les faiblesses des …
Notez que je fais tout en R. Le problème est le suivant: Fondamentalement, j'ai une liste de CV (CV). Certains candidats auront une expérience de travail avant et d'autres non. Le but ici est de: sur la base du texte de leur CV, je souhaite les classer dans différents secteurs …
Donc, je n'ai pas pu trouver de littérature sur ce sujet mais il semble que quelque chose mérite réflexion: Quelles sont les meilleures pratiques en matière de formation et d'optimisation de modèles si de nouvelles observations sont disponibles? Existe-t-il un moyen de déterminer la période / fréquence de recyclage d'un …
Je suis cet exemple sur le site Web scikit-learn pour effectuer une classification multi-sorties avec un modèle de forêt aléatoire. from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, n_classes=2, random_state=1) y2 = …
J'ai remarqué que des termes tels que hyperparamètre de modèle et paramètre de modèle ont été utilisés de manière interchangeable sur le Web sans clarification préalable. Je pense que c'est incorrect et a besoin d'explications. Considérez un modèle d'apprentissage automatique, un classificateur ou un reconnaisseur d'images basé sur SVM / …
XGBoost a fait un excellent travail en ce qui concerne les variables dépendantes catégoriques et continues. Mais, comment puis-je sélectionner les paramètres optimisés pour un problème XGBoost? Voici comment j'ai appliqué les paramètres d'un problème Kaggle récent: param <- list( objective = "reg:linear", booster = "gbtree", eta = 0.02, # …
La similitude Jaccard et la similitude cosinus sont deux mesures très courantes lors de la comparaison des similitudes des éléments. Cependant, je ne sais pas très bien dans quelle situation l’un devrait être préférable à l’autre. Quelqu'un peut-il aider à clarifier les différences de ces deux mesures (la différence de …
J'ai un peu de connaissances autodidactes travaillant avec des algorithmes d'apprentissage automatique (les trucs basiques de type Random Forest et Linear Regression). J'ai décidé de me diversifier et de commencer à apprendre les RNN avec Keras. En regardant la plupart des exemples, qui impliquent généralement des prédictions de stock, je …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.