Quelle est la meilleure façon de calculer la décomposition en valeurs singulières (SVD) d'une très grande matrice positive (65M x 3,4M) où les données sont extrêmement rares?
Moins de 0,1% de la matrice n'est pas nul. J'ai besoin d'un moyen qui:
- s'inscrira dans la mémoire (je sais qu'il existe des méthodes en ligne)
- sera calculé dans un délai raisonnable: 3,4 jours
- sera suffisamment précis, mais la précision n'est pas ma principale préoccupation et je voudrais pouvoir contrôler la quantité de ressources que j'y consacre.
Ce serait formidable d'avoir une bibliothèque Haskell, Python, C # etc. qui l'implémente. Je n'utilise pas mathlab ou R mais si nécessaire je peux aller avec R.