Science des données

2

Comment vérifier les neurones relu morts

Contexte: Lors de l'adaptation de réseaux neuronaux à l'activation de relu, j'ai constaté que parfois la prédiction devient presque constante. Je crois que cela est dû à la mort des neurones relu pendant l'entraînement, comme indiqué ici. ( Quel est le problème "mourant ReLU" dans les réseaux de neurones? ) …

10 machine-learning neural-network keras

3

Modèle récurrent (CNN) sur les données EEG

Je me demande comment interpréter une architecture récurrente dans un contexte EEG. Plus précisément, je pense à cela comme un CNN récurrent (par opposition aux architectures comme LSTM), mais peut-être que cela s'applique également à d'autres types de réseaux récurrents Quand je lis sur les R-CNN, ils sont généralement expliqués …

10 machine-learning neural-network convnet rnn

3

Un réseau de neurones artificiels (ANN) avec un nombre arbitraire d'entrées et de sorties

Je voudrais utiliser les ANN pour mon problème, mais le problème est que mes numéros de nœuds d'entrées et de sorties ne sont pas fixes. J'ai fait une recherche Google avant de poser ma question et j'ai découvert que le RNN peut m'aider avec mon problème. Mais, tous les exemples …

10 python neural-network keras rnn pytorch

1

Comment fonctionne exactement DropOut avec les couches convolutives?

Dropout ( papier , explication ) met la sortie de certains neurones à zéro. Donc, pour un MLP, vous pouvez avoir l'architecture suivante pour le jeu de données Iris flower : 4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax) Cela fonctionnerait comme ceci: s o …

10 dropout

4

Comment comparer les performances des méthodes de sélection des fonctionnalités?

Il existe plusieurs approches de sélection de caractéristiques / sélection de variables (voir par exemple Guyon et Elisseeff, 2003 ; Liu et al., 2010 ): méthodes de filtrage (par exemple, basées sur la corrélation, basées sur l'entropie, basées sur l'importance aléatoire des forêts), les méthodes d'encapsulation (par exemple, la recherche …

10 feature-selection performance model-selection

1

Spark ALS: recommander aux nouveaux utilisateurs

La question Comment prédire la note d'un nouvel utilisateur dans un modèle ALS formé à Spark? (Nouveau = pas vu pendant le temps de formation) Le problème Je suis le tutoriel officiel de Spark ALS ici: http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html Je suis en mesure de construire un bon recommandeur avec un MSE décent, …

10 apache-spark recommender-system pyspark

1

Quelle est l'importance de la fusion de modèles dans Keras?

J'ai appris que Keras a une fonctionnalité pour «fusionner» deux modèles selon ce qui suit: from keras.layers import Merge left_branch = Sequential() left_branch.add(Dense(32, input_dim=784)) right_branch = Sequential() right_branch.add(Dense(32, input_dim=784)) merged = Merge([left_branch, right_branch], mode='concat') Quel est l'intérêt des NN fusionnés, dans quelles situations est-ce utile? Est-ce une sorte de modélisation …

10 keras

4

Relation entre la sélection des caractéristiques et la précision de la classification

L'une des méthodes pour sélectionner un sous-ensemble de vos fonctionnalités disponibles pour votre classificateur consiste à les classer en fonction d'un critère (tel que le gain d'informations), puis à calculer la précision à l'aide de votre classificateur et d'un sous-ensemble des fonctionnalités classées. Par exemple, si vos fonctionnalités le sont …

10 machine-learning feature-selection

5

Saut de dimension dans l'apprentissage automatique

Quel est le problème de saut de dimension dans l'apprentissage automatique (survenant dans les réseaux de neurones convolutifs et la reconnaissance d'images)? J'ai googlé à ce sujet, mais tout ce que je reçois, c'est des informations sur la physique de la déformation des formes des matériaux. Il sera plus utile …

10 machine-learning image-recognition

4

Visualiser les articles fréquemment achetés ensemble

J'ai un jeu de données dans la structure suivante inséré dans un fichier CSV: Banana Water Rice Rice Water Bread Banana Juice Chaque ligne indique une collection d'articles achetés ensemble. Par exemple, la première ligne indique que les articles Banana, Wateret Riceont été achetés ensemble. Je veux créer une visualisation …

10 python r data-mining visualization association-rules

1

Remodelage des données pour un apprentissage en profondeur à l'aide de Keras

Je suis un débutant de Keras et j'ai commencé avec l'exemple MNIST pour comprendre comment la bibliothèque fonctionne réellement. L'extrait de code du problème MNIST dans le dossier d'exemples Keras est donné comme suit: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential …

10 python neural-network deep-learning keras

3

Quand devrions-nous considérer un ensemble de données comme déséquilibré?

Je suis confronté à une situation où les nombres d'exemples positifs et négatifs dans un ensemble de données sont déséquilibrés. Ma question est la suivante: y a-t-il des règles empiriques qui nous disent quand nous devons sous-échantillonner la grande catégorie afin de forcer une sorte d'équilibrage dans l'ensemble de données. …

10 classification dataset sampling class-imbalance

3

Word2Vec et Doc2Vec sont-ils à la fois une représentation distributionnelle ou une représentation distribuée?

J'ai lu que la représentation distributionnelle est basée sur l'hypothèse distributionnelle que les mots apparaissant dans un contexte similaire ont généralement des significations similaires. Word2Vec et Doc2Vec sont tous deux modélisés selon cette hypothèse. Mais, dans le document d'origine, même ils sont intitulés comme Distributed representation of words and phraseset …

10 nlp word-embeddings terminology word2vec

2

Structure du projet Python Machine Learning / Data Science

Je recherche des informations sur l'organisation d'un projet Python Machine Learning. Pour les projets habituels Python, il y a Cookiecutter et pour R ProjectTemplate . Il s'agit de ma structure de dossiers actuelle, mais je mélange Jupyter Notebooks avec le code Python réel et cela ne semble pas très clair. …

10 python

2

Des outils pour la détection automatique d'anomalies sur une table SQL?

J'ai une grande table SQL qui est essentiellement un journal. Les données sont assez complexes et j'essaie de trouver un moyen d'identifier les anomalies sans que je comprenne toutes les données. J'ai trouvé beaucoup d'outils pour la détection d'anomalies, mais la plupart d'entre eux nécessitent un "intermédiaire", c'est-à-dire Elastic Search, …

10 sql anomaly-detection outlier