Science des données

3

Meilleure façon de classer les ensembles de données avec des types d'attributs mixtes

Je voudrais savoir quelle est la meilleure façon de classer un ensemble de données composé de types mixtes d'attributs, par exemple textuels et numériques. Je sais que je peux convertir du textuel en booléen, mais le vocabulaire est divers et les données deviennent trop rares. J'ai également essayé de classer …

13 machine-learning classification

2

Existe-t-il des API pour analyser le résumé du papier?

Si j'ai une très longue liste de noms d'articles, comment puis-je obtenir un résumé de ces articles sur Internet ou dans une base de données? Les noms de papier sont comme "Évaluation de l'utilité dans le Web Mining pour le domaine de la santé publique". Est-ce que quelqu'un connaît une …

13 data-mining machine-learning

2

Comment implémenter la prédiction de séquence «un-à-plusieurs» et «plusieurs-à-plusieurs» dans Keras?

J'ai du mal à interpréter la différence de codage Keras pour un étiquetage de séquence un à plusieurs (par exemple, classification d'images uniques) et plusieurs à plusieurs (par exemple, classification de séquences d'images). Je vois souvent deux types de codes différents: Le type 1 est celui où aucun TimeDistributed appliqué …

13 keras rnn lstm sequence

4

Intervalle de prédiction autour des prévisions de séries chronologiques LSTM

Existe-t-il une méthode pour calculer l'intervalle de prédiction (distribution de probabilité) autour d'une série chronologique prévue à partir d'un réseau de neurones LSTM (ou autre récurrent)? Disons, par exemple, que je prédis 10 échantillons dans le futur (t + 1 à t + 10), sur la base des 10 derniers …

13 machine-learning deep-learning time-series prediction lstm

3

En quoi les NN d'apprentissage en profondeur diffèrent-ils maintenant (2016) de ceux que j'ai étudiés il y a seulement 4 ans (2012)?

Il est dit dans Wikipedia et deeplearning4j que les NN d'apprentissage en profondeur (DLNN) sont des NN qui ont> 1 couche cachée. Ce type de NN était standard à l'université pour moi, alors que DLNN est très excité en ce moment. Été là, fait ça - quel est le problème? …

13 neural-network deep-learning

3

Qu'est-ce que cela signifie lorsque nous disons que la plupart des points d'un hypercube sont à la frontière?

Si j'ai un hypercube à 50 dimensions. Et je définis sa limite par ou où est la dimension de l'hypercube. Ensuite, le calcul de la proportion de points sur la limite de l'hypercube sera de . Qu'est-ce que ça veut dire? Cela signifie-t-il que le reste de l'espace est vide? …

13 machine-learning math

2

Est-il possible de modifier la métrique utilisée par le rappel Early Stop à Keras?

Lors de l'utilisation du rappel Early Stop dans Keras, la formation s'arrête lorsqu'une mesure (généralement une perte de validation) n'augmente pas. Existe-t-il un moyen d'utiliser une autre métrique (comme la précision, le rappel, la mesure f) au lieu d'une perte de validation? Tous les exemples que j'ai vus jusqu'à présent …

13 machine-learning neural-network deep-learning keras

3

Que signifie «linéaire dans les paramètres»?

Le modèle de régression linéaire est linéaire en paramètres. Qu'est-ce que cela signifie réellement?

13 regression linear-regression

4

Dans l'algorithme SVM, pourquoi le vecteur w est orthogonal à l'hyperplan de séparation?

Je suis un débutant en Machine Learning. Dans SVM, l'hyperplan de séparation est défini comme . Pourquoi dit-on vecteur w orthogonal à l'hyperplan de séparation?y= wTx + by=wTx+by = w^T x + bwww

13 machine-learning svm

3

Langage naturel vers requête SQL

J'ai travaillé sur le développement d'un système "Conversion du langage naturel en requête SQL". J'ai lu les réponses aux questions similaires, mais je n'ai pas pu obtenir les informations que je cherchais. Voici l'organigramme d'un tel système que j'ai obtenu d' un algorithme pour transformer le langage naturel en requêtes …

13 machine-learning nlp sql natural-language-process

2

Comment appliquez-vous SMOTE sur la classification de texte?

La technique de suréchantillonnage des minorités synthétiques (SMOTE) est une technique de suréchantillonnage utilisée dans un problème de jeu de données déséquilibré. Jusqu'à présent, j'ai une idée de comment l'appliquer sur des données génériques et structurées. Mais est-il possible de l'appliquer sur un problème de classification de texte? De quelle …

13 unbalanced-classes text smote

4

Une alternative d'encodage à chaud pour les grandes valeurs catégorielles?

Bonjour, j'ai une trame de données avec de grandes valeurs catégorielles sur 1600 catégories. Est-ce que je peux trouver des alternatives pour ne pas avoir plus de 1600 colonnes. J'ai trouvé ce lien intéressant ci-dessous http://amunategui.github.io/feature-hashing/#sourcecode Mais ils se convertissent en classe / objet dont je ne veux pas. Je …

13 machine-learning dataset dimensionality-reduction encoding

5

Avantages de la base de données pandas par rapport à une base de données relationnelle régulière

En science des données, beaucoup semblent utiliser des cadres de données pandas comme magasin de données. Quelles sont les caractéristiques des pandas qui en font une banque de données supérieure par rapport aux bases de données relationnelles régulières comme MySQL , qui sont utilisées pour stocker des données dans de …

13 pandas databases

2

Mise à jour des poids des filtres dans un CNN

J'essaie actuellement de comprendre l'architecture d'un CNN. Je comprends la convolution, la couche ReLU, la couche de mise en commun et la couche entièrement connectée. Cependant, je suis toujours confus au sujet des poids. Dans un réseau neuronal normal, chaque neurone a son propre poids. Dans la couche entièrement connectée, …

13 machine-learning neural-network deep-learning image-classification cnn

4

Dimensionnalité et collecteur

Une phrase couramment entendue dans le Machine Learning non supervisé est Les entrées de grande dimension vivent généralement sur ou à proximité d'un collecteur de faible dimension Qu'est-ce qu'une dimension? Qu'est-ce qu'un collecteur? Quelle est la différence? Pouvez-vous donner un exemple pour décrire les deux? Collecteur de Wikipedia: En mathématiques, …

13 machine-learning dimensionality-reduction