J'ai une formation en programmation informatique et en théorie des nombres élémentaires, mais aucune formation en statistique réelle, et j'ai récemment "découvert" que le monde étonnant de toute une gamme de techniques est en fait un monde statistique. Il semble que les factorisations matricielles, l'achèvement de la matrice, les tenseurs de haute dimension, les plongements, l'estimation de densité, l'inférence bayésienne, les partitions de Markov, le calcul de vecteur propre, le PageRank sont tous des techniques hautement statistiques, et que les algorithmes d'apprentissage automatique qui utilisent de telles choses, utilisent beaucoup de statistiques .
Mon objectif est de pouvoir lire des articles qui discutent de telles choses, et d'implémenter ou de créer les algorithmes, tout en comprenant la notation, les "preuves" et les arguments statistiques utilisés. Je suppose que le plus difficile est de suivre toutes les preuves qui impliquent des matrices.
Quels documents de base peuvent me permettre de commencer? Ou un bon manuel avec des exercices qui valent la peine d'être travaillés?
Plus précisément, certains articles que j'aimerais comprendre complètement sont les suivants:
- Achèvement de la matrice exacte via l'optimisation convexe, Candes, Recht, 2008
- La transformation de Cauchy rapide et la régression linéaire robuste plus rapide, Clarkson et al, 2013
- Projections aléatoires pour les machines à vecteurs de support, Paul et al, 2013
- Estimation de probabilité à haute dimension avec des modèles de densité profonde, Rippel, Adams, 2013
- Obtention d'estimations minimisant les erreurs et limites d'erreur universelles d'entrée de gamme pour l'achèvement de la matrice de bas rang, Király, Theran, 2013