Science des données machine-learning

4

Pouvons-nous tirer profit de l'utilisation de l'apprentissage par transfert tout en formant des modèles word2vec?

Je cherche à trouver un poids pré-formé de modèles déjà formés comme les données de Google Actualités, etc. J'ai eu du mal à former un nouveau modèle avec suffisamment de données (10 Go, etc.) pour moi. Donc, je veux profiter de l'apprentissage par transfert dans lequel je serais en mesure …

13 machine-learning bigdata word2vec

3

Meilleure façon de classer les ensembles de données avec des types d'attributs mixtes

Je voudrais savoir quelle est la meilleure façon de classer un ensemble de données composé de types mixtes d'attributs, par exemple textuels et numériques. Je sais que je peux convertir du textuel en booléen, mais le vocabulaire est divers et les données deviennent trop rares. J'ai également essayé de classer …

13 machine-learning classification

2

Existe-t-il des API pour analyser le résumé du papier?

Si j'ai une très longue liste de noms d'articles, comment puis-je obtenir un résumé de ces articles sur Internet ou dans une base de données? Les noms de papier sont comme "Évaluation de l'utilité dans le Web Mining pour le domaine de la santé publique". Est-ce que quelqu'un connaît une …

13 data-mining machine-learning

4

Intervalle de prédiction autour des prévisions de séries chronologiques LSTM

Existe-t-il une méthode pour calculer l'intervalle de prédiction (distribution de probabilité) autour d'une série chronologique prévue à partir d'un réseau de neurones LSTM (ou autre récurrent)? Disons, par exemple, que je prédis 10 échantillons dans le futur (t + 1 à t + 10), sur la base des 10 derniers …

13 machine-learning deep-learning time-series prediction lstm

3

Qu'est-ce que cela signifie lorsque nous disons que la plupart des points d'un hypercube sont à la frontière?

Si j'ai un hypercube à 50 dimensions. Et je définis sa limite par ou où est la dimension de l'hypercube. Ensuite, le calcul de la proportion de points sur la limite de l'hypercube sera de . Qu'est-ce que ça veut dire? Cela signifie-t-il que le reste de l'espace est vide? …

13 machine-learning math

2

Est-il possible de modifier la métrique utilisée par le rappel Early Stop à Keras?

Lors de l'utilisation du rappel Early Stop dans Keras, la formation s'arrête lorsqu'une mesure (généralement une perte de validation) n'augmente pas. Existe-t-il un moyen d'utiliser une autre métrique (comme la précision, le rappel, la mesure f) au lieu d'une perte de validation? Tous les exemples que j'ai vus jusqu'à présent …

13 machine-learning neural-network deep-learning keras

4

Dans l'algorithme SVM, pourquoi le vecteur w est orthogonal à l'hyperplan de séparation?

Je suis un débutant en Machine Learning. Dans SVM, l'hyperplan de séparation est défini comme . Pourquoi dit-on vecteur w orthogonal à l'hyperplan de séparation?y= wTx + by=wTx+by = w^T x + bwww

13 machine-learning svm

3

Langage naturel vers requête SQL

J'ai travaillé sur le développement d'un système "Conversion du langage naturel en requête SQL". J'ai lu les réponses aux questions similaires, mais je n'ai pas pu obtenir les informations que je cherchais. Voici l'organigramme d'un tel système que j'ai obtenu d' un algorithme pour transformer le langage naturel en requêtes …

13 machine-learning nlp sql natural-language-process

4

Une alternative d'encodage à chaud pour les grandes valeurs catégorielles?

Bonjour, j'ai une trame de données avec de grandes valeurs catégorielles sur 1600 catégories. Est-ce que je peux trouver des alternatives pour ne pas avoir plus de 1600 colonnes. J'ai trouvé ce lien intéressant ci-dessous http://amunategui.github.io/feature-hashing/#sourcecode Mais ils se convertissent en classe / objet dont je ne veux pas. Je …

13 machine-learning dataset dimensionality-reduction encoding

2

Mise à jour des poids des filtres dans un CNN

J'essaie actuellement de comprendre l'architecture d'un CNN. Je comprends la convolution, la couche ReLU, la couche de mise en commun et la couche entièrement connectée. Cependant, je suis toujours confus au sujet des poids. Dans un réseau neuronal normal, chaque neurone a son propre poids. Dans la couche entièrement connectée, …

13 machine-learning neural-network deep-learning image-classification cnn

4

Dimensionnalité et collecteur

Une phrase couramment entendue dans le Machine Learning non supervisé est Les entrées de grande dimension vivent généralement sur ou à proximité d'un collecteur de faible dimension Qu'est-ce qu'une dimension? Qu'est-ce qu'un collecteur? Quelle est la différence? Pouvez-vous donner un exemple pour décrire les deux? Collecteur de Wikipedia: En mathématiques, …

13 machine-learning dimensionality-reduction

1

Apprentissage multi-tâches à Keras

J'essaie d'implémenter des couches partagées dans Keras. Je vois que Keras a keras.layers.concatenate, mais je ne suis pas sûr de la documentation sur son utilisation. Puis-je l'utiliser pour créer plusieurs couches partagées? Quelle serait la meilleure façon de mettre en œuvre un réseau neuronal partagé simple comme indiqué ci-dessous en …

12 machine-learning neural-network deep-learning keras multitask-learning

5

Meilleure bibliothèque Julia pour les réseaux de neurones

J'utilise cette bibliothèque pour la construction et l'analyse de réseaux neuronaux de base. Cependant, il ne prend pas en charge la construction de réseaux de neurones multicouches, etc. Donc, j'aimerais connaître de belles bibliothèques pour faire des réseaux neuronaux avancés et Deep Learning dans Julia.

12 machine-learning neural-network julia

1

Hashing Trick - ce qui se passe réellement

Lorsque les algorithmes ML, par exemple Vowpal Wabbit ou certaines des machines de factorisation remportant des concours de taux de clics ( Kaggle ), mentionnent que les fonctionnalités sont «hachées», qu'est-ce que cela signifie réellement pour le modèle? Disons qu'il existe une variable qui représente l'ID d'une annonce Internet, qui …

12 machine-learning predictive-modeling kaggle

2

Données de sentiment pour Emoji

Pour expérimenter, nous aimerions utiliser les Emoji intégrés dans de nombreux Tweets comme données de vérité / formation au sol pour une analyse quantitative de sénitment simple. Les tweets sont généralement trop peu structurés pour que la PNL fonctionne correctement. Quoi qu'il en soit, il y a 722 Emoji dans …

12 machine-learning classification parsing

Questions marquées «machine-learning»