Récemment, dans une classe d'apprentissage automatique du professeur Oriol Pujol à UPC / Barcelone, il a décrit les algorithmes, principes et concepts les plus courants à utiliser pour une large gamme de tâches liées à l'apprentissage automatique. Ici, je les partage avec vous et vous demande:
- Existe-t-il un cadre complet associant tâches et approches ou méthodes liées à différents types de problèmes liés à l'apprentissage automatique?
Comment apprendre un gaussien simple? Probabilité, variables aléatoires, distributions; estimation, convergence et asymptotique, intervalle de confiance.
Comment apprendre un mélange de Gaussiennes (MoG)? Probabilité, optimisation des attentes (EM); généralisation, sélection de modèle, validation croisée; k-moyennes, modèles de markov cachés (HMM)
Comment apprendre toute densité? Estimation paramétrique ou non paramétrique, Sobolev et autres espaces fonctionnels; erreur l ́ 2; Estimation de la densité du noyau (KDE), noyau optimal, théorie de KDE
Comment prédire une variable continue (régression)? Régression linéaire, régularisation, régression de crête et LASSO; régression linéaire locale; estimation de densité conditionnelle.
Comment prédire une variable discrète (classification)? Classificateur de Bayes, bayésien naïf, génératif ou discriminant; perceptron, perte de poids, machine à vecteurs à support linéaire; plus proche classificateur et théorie
Quelle fonction de perte devrais-je utiliser? Théorie de l'estimation du maximum de vraisemblance; l -2 estimation; Estimation bayessienne; minimax et théorie de la décision, Bayésianisme vs Fréquentisme
Quel modèle dois-je utiliser? AIC et BIC; Théorie de Vapnik-Chervonenskis; théorie de la validation croisée; amorçage; Théorie probablement approximativement correcte (PAC); Limites dérivées de Hoeffding
Comment puis-je apprendre des modèles plus sophistiqués (combinés)? Théorie de l'apprentissage d'ensemble; stimuler; ensachage; empilement
Comment puis-je apprendre des modèles plus sophistiqués (non linéaires)? Modèles linéaires généralisés, régression logistique; Théorème de Kolmogorov, modèles additifs généralisés; kernelization, reproduction des espaces de Hilbert du noyau, SVM non linéaire, régression de processus gaussienne
Comment puis-je apprendre des modèles plus sophistiqués (compositionnels)? Modèles récursifs, arbres de décision, classification hiérarchique; réseaux de neurones, rétro-propagation, réseaux de croyances profondes; modèles graphiques, mélanges de HMM, champs aléatoires conditionnels, réseaux de Markov à marge maximale; modèles log-linéaires; grammaires
Comment puis-je réduire ou associer des fonctionnalités? Sélection des fonctionnalités vs réduction des dimensions, méthodes d'encapsulation pour la sélection des fonctionnalités; causalité contre corrélation, corrélation partielle, apprentissage de la structure nette de Bayes
Comment créer de nouvelles fonctionnalités? analyse en composantes principales (PCA), analyse en composantes indépendantes (ICA), mise à l'échelle multidimensionnelle, apprentissage multiple, réduction supervisée de la dimensionnalité, apprentissage métrique
Comment puis-je réduire ou mettre en relation les données? Clustering, bi-clustering, clustering contraint; règles d'association et analyse du panier de marché; classement / régression ordinale; analyse de lien; données relationnelles
Comment traiter les séries chronologiques? ARMA; Filtre de Kalman et modèles stat-space, filtre à particules; analyse fonctionnelle des données; détection de point de changement; validation croisée pour les séries chronologiques
Comment traiter des données non idéales? décalage covariable; déséquilibre de classe; données manquantes, données échantillonnées irrégulièrement, erreurs de mesure; détection d'anomalies, robustesse
Comment optimiser les paramètres? Optimisation non contrainte vs contrainte / convexe, méthodes sans dérivées, méthodes du premier et du second ordre, ajustement en retour; gradient naturel; optimisation liée et EM
Comment optimiser les fonctions linéaires? algèbre linéaire de calcul, inversion matricielle pour la régression, décomposition en valeurs singulières (SVD) pour la réduction de la dimensionnalité
Comment puis-je optimiser avec des contraintes? Convexité, multiplicateurs de Lagrange, conditions de Karush-Kuhn-Tucker, méthodes des points intérieurs, algorithme SMO pour SVM
Comment puis-je évaluer les sommes profondément imbriquées? Inférence de modèle graphique exacte, bornes de variation sur les sommes, inférence de modèle graphique approximatif, propagation d'espérance
Comment puis-je évaluer des sommes importantes et des recherches? Problèmes généralisés à corps N (PNB), structures de données hiérarchiques, recherche du plus proche voisin, méthode rapide multiple; Intégration de Monte Carlo, chaîne de Markov Monte Carlo, Monte Carlo SVD
Comment puis-je traiter des problèmes encore plus importants? EM parallèle et distribué, PNB parallèle / distribué; méthodes sous-graduelles stochastiques, apprentissage en ligne
Comment puis-je appliquer tout cela dans le monde réel? Aperçu des parties de la ML, choix entre les méthodes à utiliser pour chaque tâche, les connaissances préalables et les hypothèses; analyse exploratoire de données et visualisation d'informations; évaluation et interprétation à l'aide d'intervalles de confiance et d'un test d'hypothèse, courbes ROC; où les problèmes de recherche en ML sont