Questions marquées «machine-learning»

Les algorithmes d'apprentissage automatique construisent un modèle des données d'apprentissage. Le terme «apprentissage automatique» est vaguement défini; il comprend ce qu'on appelle aussi l'apprentissage statistique, l'apprentissage par renforcement, l'apprentissage non supervisé, etc. TOUJOURS AJOUTER UN ÉTIQUETTE PLUS SPÉCIFIQUE.


5
L'apprentissage automatique est-il un rêve?
En découvrant l'apprentissage automatique, je vois différentes techniques intéressantes telles que: régler automatiquement les algorithmes avec des techniques telles que grid search, obtenir des résultats plus précis grâce à la combinaison de différents algorithmes du même "type", c'est-à-dire boosting, obtenir des résultats plus précis grâce à la combinaison de différents …

1
Pourquoi les gens n'utilisent-ils pas des RBF plus profonds ou des RBF en combinaison avec MLP?
Donc, en regardant les réseaux de neurones à fonction de base radiale, j'ai remarqué que les gens ne recommandent que l'utilisation d'une seule couche cachée, alors qu'avec les réseaux de neurones perceptron multicouches, plus de couches sont considérées comme meilleures. Étant donné que les réseaux RBF peuvent être entraînés avec …

2
Pourquoi le n-gramme est-il utilisé dans l'identification de la langue du texte au lieu des mots?
Dans deux bibliothèques d'identification de langue populaires, Compact Language Detector 2 pour C ++ et détecteur de langue pour java, les deux utilisaient des n-grammes (basés sur des caractères) pour extraire des fonctionnalités de texte. Pourquoi un sac de mots (un seul mot / dictionnaire) n'est-il pas utilisé, et quels …

2
Comment calculer les poids des critères Fisher?
J'étudie la reconnaissance des formes et l'apprentissage automatique, et je suis tombé sur la question suivante. Considérons un problème de classification à deux classes avec une probabilité de classe antérieure égaleP(D1)=P(D2)=12P(D1)=P(D2)=12P(D_1)=P(D_2)= \frac{1}{2} et la distribution des instances dans chaque classe donnée par p(x|D1)=N([00],[2001]),p(x|D1)=N([00],[2001]), p(x|D_1)= {\cal N} \left( \begin{bmatrix} 0 \\0 …

3
pourquoi la méthode de boosting est sensible aux valeurs aberrantes
J'ai trouvé de nombreux articles qui indiquent que les méthodes de boosting sont sensibles aux valeurs aberrantes, mais aucun article expliquant pourquoi. D'après mon expérience, les valeurs aberrantes sont mauvaises pour tout algorithme d'apprentissage automatique, mais pourquoi les méthodes de renforcement sont-elles particulièrement sensibles? Comment les algorithmes suivants se classeraient-ils …

2
Quand utiliser les réseaux bayésiens par rapport à d'autres approches d'apprentissage automatique?
J'espère qu'il n'y aura peut-être pas de réponse définitive à cette question. Mais j'ai utilisé un certain nombre d'algorithmes d'apprentissage automatique dans le passé et j'essaie d'en apprendre davantage sur les réseaux bayésiens. Je voudrais comprendre dans quelles circonstances ou pour quels types de problèmes choisiriez-vous d'utiliser le réseau bayésien …




1
Y a-t-il une différence entre une supervision à distance, une auto-formation, un apprentissage auto-supervisé et une supervision faible?
D'après ce que j'ai lu: Supervision à distance : A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled data …

3
Comprendre les paramètres de la fonction de la base gaussienne à utiliser dans la régression linéaire
Je voudrais appliquer la fonction de base gaussienne dans une implémentation de régression linéaire. Malheureusement, j'ai du mal à comprendre quelques paramètres dans la fonction de base. Plus précisément et .σμμ\muσσ\sigma Mon ensemble de données est une matrice de 10 000 x 31. 10 000 échantillons et 31 fonctionnalités. J'ai …

4
Pouvez-vous comparer différentes méthodes de clustering sur un ensemble de données sans vérité de fond par validation croisée?
Actuellement, j'essaie d'analyser un ensemble de données de document texte qui n'a aucune vérité fondamentale. On m'a dit que vous pouvez utiliser la validation croisée k-fold pour comparer différentes méthodes de clustering. Cependant, les exemples que j'ai vus dans le passé utilisent une vérité fondamentale. Existe-t-il un moyen d'utiliser les …

5
Algorithme récursif (en ligne) des moindres carrés régularisés
Quelqu'un peut-il m'orienter vers un algorithme en ligne (récursif) pour la régularisation de Tikhonov (moindres carrés régularisés)? Dans un cadre hors ligne, je calculerais β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY utilisant mon ensemble de données d'origine où λλλ est trouvé en utilisant la validation croisée n fois. Une nouvelle valeur yyy peut être prédite pour …

2
Comment appliquer des réseaux de neurones sur des problèmes de classification multi-labels?
La description: Soit le domaine problématique la classification de documents où il existe un ensemble de vecteurs de caractéristiques, chacun appartenant à 1 ou plusieurs classes. Par exemple, un document doc_1peut appartenir aux catégories Sportset English. Question: En utilisant le réseau de neurones pour la classification, quelle serait l'étiquette pour …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.