La méthode classique de l'analyse en composantes principales (ACP) consiste à le faire sur une matrice de données d'entrée dont les colonnes ont une moyenne nulle (alors l'ACP peut "maximiser la variance"). Ceci peut être réalisé facilement en centrant les colonnes. Cependant, lorsque la matrice d'entrée est clairsemée, la matrice centrée sera désormais plus clairsemée et - si la matrice est très grande - ne rentrera donc plus en mémoire. Existe-t-il une solution algorithmique pour le problème de stockage?