Contexte: Lors de l'adaptation de réseaux neuronaux à l'activation de relu, j'ai constaté que parfois la prédiction devient presque constante. Je crois que cela est dû à la mort des neurones relu pendant l'entraînement, comme indiqué ici. ( Quel est le problème "mourant ReLU" dans les réseaux de neurones? ) …
Je me demande comment interpréter une architecture récurrente dans un contexte EEG. Plus précisément, je pense à cela comme un CNN récurrent (par opposition aux architectures comme LSTM), mais peut-être que cela s'applique également à d'autres types de réseaux récurrents Quand je lis sur les R-CNN, ils sont généralement expliqués …
Je voudrais utiliser les ANN pour mon problème, mais le problème est que mes numéros de nœuds d'entrées et de sorties ne sont pas fixes. J'ai fait une recherche Google avant de poser ma question et j'ai découvert que le RNN peut m'aider avec mon problème. Mais, tous les exemples …
Dropout ( papier , explication ) met la sortie de certains neurones à zéro. Donc, pour un MLP, vous pouvez avoir l'architecture suivante pour le jeu de données Iris flower : 4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax) Cela fonctionnerait comme ceci: s o …
Il existe plusieurs approches de sélection de caractéristiques / sélection de variables (voir par exemple Guyon et Elisseeff, 2003 ; Liu et al., 2010 ): méthodes de filtrage (par exemple, basées sur la corrélation, basées sur l'entropie, basées sur l'importance aléatoire des forêts), les méthodes d'encapsulation (par exemple, la recherche …
La question Comment prédire la note d'un nouvel utilisateur dans un modèle ALS formé à Spark? (Nouveau = pas vu pendant le temps de formation) Le problème Je suis le tutoriel officiel de Spark ALS ici: http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html Je suis en mesure de construire un bon recommandeur avec un MSE décent, …
J'ai appris que Keras a une fonctionnalité pour «fusionner» deux modèles selon ce qui suit: from keras.layers import Merge left_branch = Sequential() left_branch.add(Dense(32, input_dim=784)) right_branch = Sequential() right_branch.add(Dense(32, input_dim=784)) merged = Merge([left_branch, right_branch], mode='concat') Quel est l'intérêt des NN fusionnés, dans quelles situations est-ce utile? Est-ce une sorte de modélisation …
L'une des méthodes pour sélectionner un sous-ensemble de vos fonctionnalités disponibles pour votre classificateur consiste à les classer en fonction d'un critère (tel que le gain d'informations), puis à calculer la précision à l'aide de votre classificateur et d'un sous-ensemble des fonctionnalités classées. Par exemple, si vos fonctionnalités le sont …
Quel est le problème de saut de dimension dans l'apprentissage automatique (survenant dans les réseaux de neurones convolutifs et la reconnaissance d'images)? J'ai googlé à ce sujet, mais tout ce que je reçois, c'est des informations sur la physique de la déformation des formes des matériaux. Il sera plus utile …
J'ai un jeu de données dans la structure suivante inséré dans un fichier CSV: Banana Water Rice Rice Water Bread Banana Juice Chaque ligne indique une collection d'articles achetés ensemble. Par exemple, la première ligne indique que les articles Banana, Wateret Riceont été achetés ensemble. Je veux créer une visualisation …
Je suis un débutant de Keras et j'ai commencé avec l'exemple MNIST pour comprendre comment la bibliothèque fonctionne réellement. L'extrait de code du problème MNIST dans le dossier d'exemples Keras est donné comme suit: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential …
Je suis confronté à une situation où les nombres d'exemples positifs et négatifs dans un ensemble de données sont déséquilibrés. Ma question est la suivante: y a-t-il des règles empiriques qui nous disent quand nous devons sous-échantillonner la grande catégorie afin de forcer une sorte d'équilibrage dans l'ensemble de données. …
J'ai lu que la représentation distributionnelle est basée sur l'hypothèse distributionnelle que les mots apparaissant dans un contexte similaire ont généralement des significations similaires. Word2Vec et Doc2Vec sont tous deux modélisés selon cette hypothèse. Mais, dans le document d'origine, même ils sont intitulés comme Distributed representation of words and phraseset …
Je recherche des informations sur l'organisation d'un projet Python Machine Learning. Pour les projets habituels Python, il y a Cookiecutter et pour R ProjectTemplate . Il s'agit de ma structure de dossiers actuelle, mais je mélange Jupyter Notebooks avec le code Python réel et cela ne semble pas très clair. …
J'ai une grande table SQL qui est essentiellement un journal. Les données sont assez complexes et j'essaie de trouver un moyen d'identifier les anomalies sans que je comprenne toutes les données. J'ai trouvé beaucoup d'outils pour la détection d'anomalies, mais la plupart d'entre eux nécessitent un "intermédiaire", c'est-à-dire Elastic Search, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.