Science des données

Questions-réponses pour les professionnels de la science des données, les spécialistes en apprentissage automatique et les personnes intéressées

3
Existe-t-il de bons modèles de langage prêts à l'emploi pour python?
Je prototype une application et j'ai besoin d'un modèle de langage pour calculer la perplexité sur certaines phrases générées. Existe-t-il un modèle de langage formé en python que je peux facilement utiliser? Quelque chose de simple comme model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

1
Utiliser un classificateur CNN pré-formé et l'appliquer sur un ensemble de données d'image différent
Comment pourriez-vous optimiser un pré-formé neural network pour l'appliquer à un problème distinct? Souhaitez-vous simplement ajouter plus de couches au modèle pré-formé et le tester sur votre ensemble de données? Par exemple, si la tâche consistait à utiliser un CNN pour classer les groupes de papiers peints , je suis …

1
Comment prédire les valeurs futures de l'horizon temporel avec Keras?
Je viens de construire ce réseau neuronal LSTM avec Keras import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import Sequential from matplotlib import pyplot #read and prepare data from datafile …




2
Trouver le P optimal (X | Y) étant donné que j'ai un modèle qui a de bonnes performances lorsqu'il est formé sur P (Y | X)
Des données d'entrée: XXX -> caractéristiques du t-shirt (couleur, logo, etc.) YYY -> marge bénéficiaire J'ai formé une forêt aléatoire sur les et ci-dessus et j'ai atteint une précision raisonnable sur les données d'un test. Donc j'aiXXXYYY P(Y|X)P(Y|X)P(Y|X) . Maintenant, je voudrais trouver c'est-à-dire la distribution de probabilité des caractéristiques …

2
Quelle est la différence entre la convolution dilatée et la déconvolution?
Ces deux opérations de convolution sont très courantes dans le deep learning en ce moment. J'ai lu sur la couche convolutionnelle dilatée dans cet article: WAVENET: UN MODÈLE GÉNÉRATIF POUR L'AUDIO BRUT et la déconvolution est dans cet article: Réseaux entièrement convolutifs pour la segmentation sémantique Les deux semblent sur-échantillonner …

1
Traitement accéléré des données GPU pour R dans Windows
Je prends actuellement un article sur le Big Data qui nous fait utiliser R fortement pour l'analyse des données. Il se trouve que j'ai un GTX1070 dans mon PC pour des raisons de jeu. Ainsi, je pensais que ce serait vraiment cool si je pouvais utiliser cela pour accélérer une …
11 r  gpu  parallel 

2
Combien de données sont suffisantes pour former mon modèle d'apprentissage automatique?
Je travaille sur l'apprentissage automatique et la bioinformatique depuis un certain temps, et aujourd'hui j'ai eu une conversation avec un collègue sur les principaux problèmes généraux de l'exploration de données. Mon collègue (qui est un expert en apprentissage automatique) a déclaré que, selon lui, l'aspect pratique sans doute le plus …

1
Entraînez-vous par lots dans Tensorflow
J'essaie actuellement de former un modèle sur un gros fichier csv (> 70 Go avec plus de 60 millions de lignes). Pour ce faire, j'utilise tf.contrib.learn.read_batch_examples. J'ai du mal à comprendre comment cette fonction lit réellement les données. Si j'utilise par exemple une taille de lot de 50 000, lit-il …

4
Extraire des informations de la phrase
Je crée un chatbot simple. Je souhaite obtenir les informations de la réponse de l'utilisateur. Un exemple de scénario: Bot : Hi, what is your name? User: My name is Edwin. Je souhaite extraire le nom Edwin de la phrase. Cependant, l'utilisateur peut répondre de différentes manières telles que User: …
11 python  nlp 



1
Comment définir une métrique de performance personnalisée dans Keras?
J'ai essayé de définir une fonction métrique personnalisée (F1-Score) dans Keras (backend Tensorflow) en fonction de ce qui suit: def f1_score(tags, predicted): tags = set(tags) predicted = set(predicted) tp = len(tags & predicted) fp = len(predicted) - tp fn = len(tags) - tp if tp>0: precision=float(tp)/(tp+fp) recall=float(tp)/(tp+fn) return 2*((precision*recall)/(precision+recall)) else: …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.