J'ai 2 jeux de données, un avec des instances positives de ce que je voudrais détecter et un avec des instances sans étiquette. Quelles méthodes puis-je utiliser? Par exemple, supposons que nous voulons comprendre la détection des e-mails de spam sur la base de quelques caractéristiques structurées des e-mails. Nous …
Google Trends renvoie des données hebdomadaires, je dois donc trouver un moyen de les fusionner avec mes données quotidiennes / mensuelles. Ce que j'ai fait jusqu'à présent, c'est de décomposer chaque série en données quotidiennes, par exemple: de: 2013-03-03 - 2013-03-09 37 à: 2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 …
J'essaie de résoudre un ensemble d'équations qui a 40 variables indépendantes (x1, ..., x40) et une variable dépendante (y). Le nombre total d'équations (nombre de lignes) est ~ 300, et je veux résoudre pour l'ensemble des 40 coefficients qui minimise l'erreur totale de somme des carrés entre y et la …
Je construis souvent un modèle (classification ou régression) où j'ai des variables prédictives qui sont des séquences et j'ai essayé de trouver des recommandations techniques pour les résumer de la meilleure façon possible pour les inclure comme prédicteurs dans le modèle. À titre d'exemple concret, disons qu'un modèle est en …
Nous avons donc un potentiel pour une application d'apprentissage automatique qui s'intègre assez bien dans le domaine de problème traditionnel résolu par les classificateurs, c'est-à-dire que nous avons un ensemble d'attributs décrivant un élément et un "compartiment" dans lequel ils se retrouvent. Cependant, plutôt que de créer des modèles de …
Je pensais que le modèle linéaire généralisé (GLM) serait considéré comme un modèle statistique, mais un ami m'a dit que certains articles le classaient comme une technique d'apprentissage automatique. Laquelle est vraie (ou plus précise)? Toute explication serait appréciée.
Dans notre entreprise, nous avons une base de données MongoDB contenant un grand nombre de données non structurées, sur lesquelles nous devons exécuter des algorithmes de réduction de carte pour générer des rapports et d'autres analyses. Nous avons le choix entre deux approches pour la mise en œuvre des analyses …
En utilisant un multicouche LSTMavec dropout, est-il conseillé de mettre le dropout sur tous les calques cachés ainsi que sur les calques Denses en sortie? Dans l'article de Hinton (qui proposait Dropout), il ne plaçait Dropout que sur les couches Denses, mais c'était parce que les couches internes cachées étaient …
Dans le cadre de mes recherches, je m'intéresse à la propagation d'étiquettes sur un graphe. Je suis particulièrement intéressé par ces deux méthodes: Xiaojin Zhu et Zoubin Ghahramani. Apprendre à partir de données étiquetées et non étiquetées avec propagation d'étiquettes. Rapport technique CMU-CALD-02-107, Université Carnegie Mellon, 2002 http://pages.cs.wisc.edu/~jerryzhu/pub/CMU-CALD-02-107.pdf Dengyong Zhou, …
Je travaille sur le modèle Seq2Seq en utilisant LSTM de Keras (en utilisant l'arrière-plan de Theano) et je voudrais paralléliser les processus, car même peu de Mo de données nécessitent plusieurs heures de formation. Il est clair que les GPU sont bien meilleurs en parallélisation que les CPU. Pour le …
Je convertis un corpus de documents texte en vecteurs de mots pour chaque document. J'ai essayé ceci en utilisant un TfidfVectorizer et un HashingVectorizer Je comprends qu'un a HashingVectorizerne prend pas en compte les IDFscores comme un le TfidfVectorizerfait. La raison pour laquelle je travaille toujours avec HashingVectorizerest la flexibilité …
Je suis nouveau sur TensorFlow et j'ai besoin de comprendre les capacités et les défauts de TensorFlow avant de pouvoir l'utiliser. Je sais qu'il s'agit d'un cadre d'apprentissage en profondeur, mais en dehors de celui que d'autres algorithmes d'apprentissage automatique peuvent utiliser avec le flux tensoriel. Par exemple, pouvons-nous utiliser …
Je suis un peu confus par la coexistence de métriques de perte et de précision dans les réseaux neuronaux. Les deux sont censés rendre la « rigueur » de la comparaison yyy et y , sont - ils pas? Alors, l'application des deux n'est-elle pas redondante dans les périodes d'entraînement? …
J'essaie de comprendre combien de poids et de biais sont nécessaires pour CNN. Disons que j'ai une image (3, 32, 32) et que je souhaite appliquer un filtre (32, 5, 5). Pour chaque carte d'entités, j'ai des poids 5x5, donc je devrais avoir 3 paramètres (5x5) x 32. Maintenant, je …
En essayant de faire par exemple une classification, mon approche est actuellement de essayez d'abord différents algorithmes et comparez-les effectuer la sélection des fonctionnalités sur le meilleur algorithme parmi 1 régler les paramètres en utilisant les fonctionnalités et l'algorithme sélectionnés Cependant, je ne peux souvent pas me convaincre qu'il peut …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.