Comment fonctionnent les bases de données en colonnes?
La base de données en colonnes est un concept plutôt une architecture / implémentation particulière . En d'autres termes, il n'y a pas une description particulière du fonctionnement de ces bases de données; en effet, plusieurs sont basés sur des SGBD traditionnels, orientés lignes, stockant simplement les informations dans des tables avec une (ou plutôt souvent deux) colonnes (et ajoutant la couche nécessaire pour accéder aux données en colonnes de manière simple).
En quoi diffèrent-ils des bases de données relationnelles?
Ils diffèrent généralement des bases de données traditionnelles (orientées lignes) en ce qui concerne ...
- performance...
- exigences de stockage ...
- facilité de modification du schéma ...
... dans des cas d'utilisation spécifiques des SGBD .
En particulier, ils offrent des avantages dans les domaines mentionnés lorsque l'utilisation typique est de calculer des valeurs agrégées sur un nombre limité de colonnes, par opposition à essayer de récupérer toutes / la plupart des colonnes pour une entité donnée.
Existe-t-il une version d'essai d'une base de données en colonnes que je peux installer pour jouer? (Je suis sur Windows 7)
Oui, il existe des implémentations commerciales, gratuites et également open-source de bases de données en colonnes. Voir la liste à la fin de l'article Wikipédia pour commencer.
Sachez que plusieurs de ces implémentations ont été introduites pour répondre à un besoin particulier (par exemple, très faible encombrement, distribution de données hautement compressible, ou émulation de matrice de rechange, etc.) plutôt que de fournir un SGBD orienté colonne à usage général en soi.
Remarque: La remarque sur «l'orientation à un seul objectif» de plusieurs SGBD en colonnes n'est pas une critique de ces implémentations, mais plutôt une indication supplémentaire qu'une telle approche pour les SGBD s'écarte de l'approche plus «naturelle» (et certainement plus largement utilisée) pour stocker les entités d'enregistrement. En conséquence, cette approche est utilisée lorsque l'approche axée sur les lignes n'est pas satisfaisante et a donc tendance à
a) être ciblée dans un but particulier b) recevoir moins de ressources / d'intérêt que les travaux sur «Usage général», «Essayé et Testé ", approche tabulaire.
À titre provisoire, le modèle de données Entity-Attribute-Value (EAV) peut être une stratégie de stockage alternative que vous voudrez peut-être envisager. Bien que distinct du modèle de base de données colonne «pur», EAV partage plusieurs des caractéristiques des bases de données colonne.