Dans un ordinateur, vous disposez de plusieurs couches de mémoire, que vous pouvez imaginer "plus proches" ou "plus éloignées" du processeur.
Les mémoires proches du processeur sont rapides mais petites, et les mémoires éloignées du processeur sont grandes mais lentes.
La mémoire la plus rapide est composée par les registres du processeur, auxquels le processeur peut accéder immédiatement. Ensuite, vous avez le cache de données L1, qui est généralement de 32 Ko et accessible en un seul cycle d'horloge, puis le cache L2 / L3, qui fait peu de Mo (de 2 à 12 Mo) et peut être consulté en dizaines de cycles d'horloge. Vient ensuite la mémoire principale, beaucoup plus volumineuse (quelques giga-octets) mais très lente (des centaines de cycles d’horloge sont accessibles). Viennent ensuite les disques, qui font des centaines de gigaoctets mais sont tellement lents;)
Ceci est communément appelé hiérarchie de la mémoire.
Ce que vous voulez, idéalement, ce sont des souvenirs aussi gros que des disques, mais aussi rapides que des registres. Pour se rapprocher le plus possible de cela, les données sont continuellement déplacées de la RAM vers les registres et vice-versa.
Qui fait tout ça? Eh bien, la hiérarchie est gérée de manière automatique, de la L1 à la mémoire principale par le processeur, tandis que la mémoire principale et le disque sont gérés par le système d’exploitation en coopération avec le processeur.
L’histoire complète est bien plus technique et compliquée, mais j’espère que cela vous donnera des idées;)