J'ai une question très basique qui concerne Python, numpy et la multiplication des matrices dans le cadre de la régression logistique. Tout d'abord, permettez-moi de m'excuser de ne pas utiliser la notation mathématique. Je suis confus quant à l'utilisation de la multiplication matricielle par rapport à la multiplication par éléments. …
Je travaille sur un défi Kaggle où certaines variables sont représentées par des lignes au lieu de colonnes (Telstra Network Disruption). Je suis actuellement à la recherche de l'équivalent de recueillir (), séparé () et réparti (), qui peut être trouvé dans l'outil R tidyr.
L'article Aller plus loin avec les circonvolutions décrit GoogleNet qui contient les modules de création d'origine: La modification de la création v2 a consisté à remplacer les convolutions 5x5 par deux convolutions 3x3 successives et à appliquer le pooling: Quelle est la différence entre Inception v2 et Inception v3?
J'utilise des réseaux de neurones depuis un certain temps maintenant. Cependant, une chose avec laquelle je me bats constamment est la sélection d'un optimiseur pour la formation du réseau (en utilisant backprop). Ce que je fais habituellement, c'est de commencer par un seul (par exemple SGD standard), puis d'essayer d'autres …
Je suis assez nouveau dans les réseaux de neurones, mais je comprends assez bien l'algèbre linéaire et les mathématiques de la convolution. J'essaie de comprendre l'exemple de code que je trouve à divers endroits sur le net pour former un NN convolutionnel Keras avec des données MNIST pour reconnaître les …
De Keras RNN Tutorial: "Les RNN sont difficiles. Le choix de la taille des lots est important, le choix de la perte et de l'optimiseur est critique, etc. Certaines configurations ne convergent pas." Il s'agit donc plus d'une question générale sur le réglage des hyperparamètres d'un LSTM-RNN sur Keras. Je …
Dans ma classe, je dois créer une application à l'aide de deux classificateurs pour décider si un objet dans une image est un exemple de phylum porifera (seaponge) ou un autre objet. Cependant, je suis complètement perdu en ce qui concerne les techniques d'extraction de fonctionnalités en python. Mon conseiller …
Si j'ai un magasin de détail et que j'ai un moyen de mesurer le nombre de personnes qui entrent dans mon magasin chaque minute et d'horodater ces données, comment puis-je prédire le trafic piétonnier futur? J'ai étudié les algorithmes d'apprentissage automatique, mais je ne sais pas lequel utiliser. Dans mes …
J'ai deux phrases, S1 et S2, qui ont toutes deux un nombre de mots (généralement) inférieur à 15. Quels sont les algorithmes les plus utiles et les plus efficaces (apprentissage automatique), qui sont peut-être faciles à mettre en œuvre (le réseau de neurones est correct, sauf si l'architecture est aussi …
J'ai entendu Andrew Ng (dans une vidéo que je ne trouve malheureusement plus) parler de la façon dont la compréhension des minima locaux dans les problèmes d'apprentissage profond a changé en ce sens qu'ils sont maintenant considérés comme moins problématiques car dans les espaces de grande dimension (rencontrés dans apprentissage …
J'essaie de supprimer les mots vides avant d'effectuer la modélisation du sujet. J'ai remarqué que certains mots de négation (pas, ni, jamais, aucun, etc.) sont généralement considérés comme des mots vides. Par exemple, NLTK, spacy et sklearn incluent "not" dans leurs listes de mots vides. Cependant, si nous supprimons «non» …
Je voudrais faire une réduction de dimensionnalité sur près d'un million de vecteurs chacun avec 200 dimensions ( doc2vec). j'utiliseTSNE implémentation du sklearn.manifoldmodule pour cela et le problème majeur est la complexité du temps. Même avec method = barnes_hut, la vitesse de calcul est encore faible. Un certain temps, même …
Supposons que nous avons un ensemble d'éléments E et une similitude ( non loin ) fonction SIM (ei, ej) entre deux éléments ei, ej ∈ E . Comment pourrions-nous (efficacement) regrouper les éléments de E , en utilisant sim ? k -moyen, par exemple, nécessite un k donné , Canopy …
Je parcourais le papier BERT qui utilise GELU (Gaussian Error Linear Unit) qui énonce l'équation comme qui à son tour est approximativement àG EL U( x ) = x P( X≤ x ) = x Φ ( x ) .gELU(X)=XP(X≤X)=XΦ(X). GELU(x) = xP(X ≤ x) = xΦ(x).0.5x(1+tanh[2/π−−−√(x+0.044715x3)])0,5X(1+tunenh[2/π(X+0,044715X3)])0.5x(1 + tanh[\sqrt{ 2/π}(x …
J'essaie de comprendre le rôle de la dérivée de la fonction sigmoïde dans les réseaux de neurones. Je trace d'abord la fonction sigmoïde et la dérivée de tous les points de la définition à l'aide de python. Quel est exactement le rôle de ce dérivé? import numpy as np import …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.