Je cherche à trouver un poids pré-formé de modèles déjà formés comme les données de Google Actualités, etc. J'ai eu du mal à former un nouveau modèle avec suffisamment de données (10 Go, etc.) pour moi. Donc, je veux profiter de l'apprentissage par transfert dans lequel je serais en mesure …
Je voudrais savoir quelle est la meilleure façon de classer un ensemble de données composé de types mixtes d'attributs, par exemple textuels et numériques. Je sais que je peux convertir du textuel en booléen, mais le vocabulaire est divers et les données deviennent trop rares. J'ai également essayé de classer …
Si j'ai une très longue liste de noms d'articles, comment puis-je obtenir un résumé de ces articles sur Internet ou dans une base de données? Les noms de papier sont comme "Évaluation de l'utilité dans le Web Mining pour le domaine de la santé publique". Est-ce que quelqu'un connaît une …
Existe-t-il une méthode pour calculer l'intervalle de prédiction (distribution de probabilité) autour d'une série chronologique prévue à partir d'un réseau de neurones LSTM (ou autre récurrent)? Disons, par exemple, que je prédis 10 échantillons dans le futur (t + 1 à t + 10), sur la base des 10 derniers …
Si j'ai un hypercube à 50 dimensions. Et je définis sa limite par ou où est la dimension de l'hypercube. Ensuite, le calcul de la proportion de points sur la limite de l'hypercube sera de . Qu'est-ce que ça veut dire? Cela signifie-t-il que le reste de l'espace est vide? …
Lors de l'utilisation du rappel Early Stop dans Keras, la formation s'arrête lorsqu'une mesure (généralement une perte de validation) n'augmente pas. Existe-t-il un moyen d'utiliser une autre métrique (comme la précision, le rappel, la mesure f) au lieu d'une perte de validation? Tous les exemples que j'ai vus jusqu'à présent …
Je suis un débutant en Machine Learning. Dans SVM, l'hyperplan de séparation est défini comme . Pourquoi dit-on vecteur w orthogonal à l'hyperplan de séparation?y= wTx + by=wTx+by = w^T x + bwww
J'ai travaillé sur le développement d'un système "Conversion du langage naturel en requête SQL". J'ai lu les réponses aux questions similaires, mais je n'ai pas pu obtenir les informations que je cherchais. Voici l'organigramme d'un tel système que j'ai obtenu d' un algorithme pour transformer le langage naturel en requêtes …
Bonjour, j'ai une trame de données avec de grandes valeurs catégorielles sur 1600 catégories. Est-ce que je peux trouver des alternatives pour ne pas avoir plus de 1600 colonnes. J'ai trouvé ce lien intéressant ci-dessous http://amunategui.github.io/feature-hashing/#sourcecode Mais ils se convertissent en classe / objet dont je ne veux pas. Je …
J'essaie actuellement de comprendre l'architecture d'un CNN. Je comprends la convolution, la couche ReLU, la couche de mise en commun et la couche entièrement connectée. Cependant, je suis toujours confus au sujet des poids. Dans un réseau neuronal normal, chaque neurone a son propre poids. Dans la couche entièrement connectée, …
Une phrase couramment entendue dans le Machine Learning non supervisé est Les entrées de grande dimension vivent généralement sur ou à proximité d'un collecteur de faible dimension Qu'est-ce qu'une dimension? Qu'est-ce qu'un collecteur? Quelle est la différence? Pouvez-vous donner un exemple pour décrire les deux? Collecteur de Wikipedia: En mathématiques, …
J'essaie d'implémenter des couches partagées dans Keras. Je vois que Keras a keras.layers.concatenate, mais je ne suis pas sûr de la documentation sur son utilisation. Puis-je l'utiliser pour créer plusieurs couches partagées? Quelle serait la meilleure façon de mettre en œuvre un réseau neuronal partagé simple comme indiqué ci-dessous en …
J'utilise cette bibliothèque pour la construction et l'analyse de réseaux neuronaux de base. Cependant, il ne prend pas en charge la construction de réseaux de neurones multicouches, etc. Donc, j'aimerais connaître de belles bibliothèques pour faire des réseaux neuronaux avancés et Deep Learning dans Julia.
Lorsque les algorithmes ML, par exemple Vowpal Wabbit ou certaines des machines de factorisation remportant des concours de taux de clics ( Kaggle ), mentionnent que les fonctionnalités sont «hachées», qu'est-ce que cela signifie réellement pour le modèle? Disons qu'il existe une variable qui représente l'ID d'une annonce Internet, qui …
Pour expérimenter, nous aimerions utiliser les Emoji intégrés dans de nombreux Tweets comme données de vérité / formation au sol pour une analyse quantitative de sénitment simple. Les tweets sont généralement trop peu structurés pour que la PNL fonctionne correctement. Quoi qu'il en soit, il y a 722 Emoji dans …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.