Vorige week organiseerden we een ontbijtsessie bij Understanding Data. Zoals het hoort lagen er koffiekoeken klaar. Veel koffiekoeken. Tijdens de sessie maakten we enkele foto’s van de tafel. Op het eerste gezicht zijn dit gewoon leuke sfeerbeelden. Maar eigenlijk tonen die foto’s perfect wat een snapshot is in de datawereld.
Een snapshot is een momentopname van data op een specifiek tijdstip.
Net zoals een foto vastlegt hoeveel koffiekoeken er om 8u30 op tafel lagen, bewaart een snapshot hoe een dataset eruitzag op een bepaald moment. Dat lijkt eenvoudig, maar het is enorm waardevol. Want zonder snapshots zie je enkel de huidige situatie, niet hoe je daar bent geraakt.
Stel dat we enkel de laatste foto hadden genomen. Dan zouden we weten dat er zes koffiekoeken over waren. Maar we zouden geen idee hebben:
Met snapshots kunnen we evoluties analyseren in plaats van enkel statussen bekijken.
Natuurlijk geldt ook hier: hoe meer snapshots je neemt, hoe meer detail je hebt. Met drie foto’s zien we het algemene verloop van de ontbijtsessie. Hadden we elke minuut een foto genomen, dan konden we exact analyseren wanneer de ronde rozijnenkoeken verdwenen en welke koffiekoeken het populairst waren.
In data werkt het net hetzelfde. Meer snapshots geven meer historisch inzicht, maar vragen ook meer opslagruimte en verwerking. De juiste frequentie hangt dus af van wat je wil analyseren.
Veel systemen overschrijven data voortdurend.
Een klant verandert van adres? Het oude adres verdwijnt.
Een productprijs stijgt? De vorige prijs wordt vervangen.
Voor operationele processen is dat vaak prima. Maar voor analyses verlies je zo belangrijke context. Snapshots lossen dat probleem op door regelmatig een toestand te bewaren.
Tijd is vaak een ontbrekende dimensie in rapportering. Een snapshot voegt die dimensie toe. Plots kan je vragen beantwoorden zoals:
Tijd wordt zo een volwaardige dimensie in je data, en dat is essentieel voor betrouwbare rapportering en analyse.
Tot nu toe hebben we snapshots uitgelegd met foto’s. Maar hoe werkt dat in een datasysteem? In datawarehousing spreken we over Slowly Changing Dimensions (SCD): manieren om met veranderingen in data om te gaan.
In de praktijk zijn er twee manieren om hiermee om te gaan:
SCD Type 1 (overschrijven)
De eenvoudigste aanpak is om data gewoon te overschrijven. De nieuwste waarde vervangt de oude.
In onze metafoor: je kijkt alleen naar de tafel op dit moment. Je ziet wat er nog ligt, maar niet wat er eerder was.
Dit is geschikt voor operationele systemen waar alleen de huidige toestand telt.
SCD Type 2 (geschiedenis bewaren)
Je kan er ook voor kiezen om elke verandering te bewaren. In plaats van te overschrijven, voeg je een nieuwe versie toe.
De oude waarde wordt afgesloten met een einddatum en er wordt een nieuw record in de tabel aangemaakt met een startdatum. Hierdoor kan je de volledige evolutie van de data reconstrueren en zien hoe iets eruitzag op een bepaald moment in de tijd.
In onze metafoor: je bewaart alle foto’s die je neemt, zodat je achteraf kan zien hoe de tafel evolueerde.
Snapshots lijken eenvoudig, maar vormen vaak de basis voor betrouwbare analyses, trenddetectie en historisch inzicht.
En soms begint dat inzicht gewoon met een tafel vol koffiekoeken.
Benieuwd hoe snapshots jouw rapportering of data platform sterker kunnen maken? Contacteer ons nu.
Zet je data-ambities om in een duidelijke, uitvoerbare strategie. Onze experts werken met jou samen om te bepalen waar je nu staat, waar je naartoe wilt en hoe je dat gaat bereiken.