Eine relationale Datenbank besteht aus Tabellen. Diese Tabellen sind zeilenorientiert: ein Tabelleneintrag entspricht einer Zeile, jede Spalte hat einen Namen und einen Datentyp. In spaltenorientierten Datenbanken werden die Spalten getrennt voneinander gespeichert.

Dieser Ansatz hat mehrere Vorteile, aber auch Nachteile. Der entscheidende Vorteil ist, dass alle Aktionen (Speichern, Lesen, Aggregieren), die vielen Zeilen aber nur wenigen Spalten betreffen, effizienter funktionieren. Der Grund ist, dass eben nur die benötigten Spalten und nicht die ganze Tabelle geschrieben oder gelesen werden muss. Im Umkehrschluss sind eben alle Aktionen, die sich auf eine oder eher wenige Zeile, aber viele Spalten einer Tabelle beziehen, nicht so effizient. So ist zum Beispiel das Löschen einer ganzen Zeile recht aufwändig.

Auch bei der Skalierbarkeit ergeben sich Vorteile, denn die Spalten können leicht auf verschiedene Server verteilt werden und somit parallel bearbeitet werden. Daher kommen spaltenorientierte Datenbanken häufiger bei Big Data zum Einsatz. Sie gehören zur Klasse der NoSQL-Datenbanken.

Es gibt eine Reihe verschiedener Software für die Realisierung solch einer Datenbank. Eine der populärsten spaltenorientierten Datenbanken ist Apache Cassandra, welche open-source ist und von Unternehmen wie Apple, Twitter und Spotify genutzt wird.