Wat is een ster schema data model?

Wat is er mis met één platte tabel waarin alle data staat? Waarom moet ik data modelleren volgens een ster schema ontwerp?

Dit is een vraag die veel Excel gebruikers (waaronder ikzelf in het verleden) gesteld hebben toen ze Power BI gingen gebruiken. Vandaag begin ik een serie posts waarin ik argumenten geef vóór het ster schema model data model en tégen de platte tabel.

Laten we beginnen met definities. Wat is het ster schema data model eigenlijk? Een ster schema is een datamodel dat wordt gebruikt in data warehousing en dat is opgebouwd rondom een centrale feitentabel, omringd door dimensionele tabellen die de context van de gegevens beschrijven. Deze tabellen zijn met elkaar verbonden door middel van primary/foreign key relaties (meer hierover in een latere post). Het wordt een “ster schema” genoemd vanwege de visuele weergave, waarbij de feitentabel in het midden staat en de dimensionele tabellen als stralen eromheen liggen, vergelijkbaar met een ster (zie onderstaande afbeelding).

Het belangrijkste kenmerk van een ster schema is de scheiding van meetwaarden (feiten) en de bijbehorende dimensies. De feitentabel bevat numerieke gegevens of meetwaarden die kunnen worden geaggregeerd, zoals verkoopbedragen of aantallen. De dimensietabellen bevatten de beschrijvende gegevens die de context van de feiten verschaffen, zoals tijd, product, locatie, klant, etc. Dimensies worden vaak als hiërarchische structuren georganiseerd, bijvoorbeeld met de tijd dimensie die niveaus heeft zoals jaar, maand en dag.

Wanneer je een platte tabel ombouwt naar een ster schema heet dit proces “Normaliseren”.

Leave Comment

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *