Je voudrais faire une réduction de dimensionnalité sur près d'un million de vecteurs chacun avec 200 dimensions ( doc2vec
). j'utiliseTSNE
implémentation du sklearn.manifold
module pour cela et le problème majeur est la complexité du temps. Même avec method = barnes_hut
, la vitesse de calcul est encore faible. Un certain temps, même il manque de mémoire.
Je l'exécute sur un processeur à 48 cœurs avec 130 Go de RAM. Existe-t-il une méthode pour l'exécuter en parallèle ou utiliser la ressource abondante pour accélérer le processus.