Ontdek hoe onze expertise op het gebied van datastrategie, architectuur en implementatie meetbare resultaten oplevert voor onze klanten.
Bol maakt hun product elke dag beter door klantgedrag te meten en verbeteringen te identificeren. Ze gebruikten een dure externe tool om gebruikersgedrag te meten en te analyseren. De tool was nét niet goed genoeg en ze wilden wisselen naar een zelfbouw-tool op basis van technologie Apache Kafka. Hier konden ze meer mee, maar het was een stuk complexer om mee te werken. Onze rol? Maak dit gemakkelijker.
De interne tool had veel meer informatie dan de externe, maar meer is niet per se beter. Door veel detail is het moeilijk om door de bomen het bos te zien. Het moest eenvoudiger. Het doel was de tool eenvoudiger te maken zodat analyses sneller en makkelijker konden.
We focusten op twee kernonderdelen: klantgedrag en financiële resultaten. Samen met interne stakeholders ontwierpen we een modulaire structuur en bouwden we een proof of concept om A/B-tests uitvoerig te kunnen analyseren.
We braken de gigantische hoeveelheid data op in verschillende modules met dbt en BigQuery. We maakten een duidelijke flow van data waardoor A/B tests sneller, consistenter én correcter konden worden uitgevoerd. We introduceerden data tests, en stroomlijnden het hele proces. We ontwikkelden dashboards die op deze nieuwe, nette data werkte. De grootste complexiteit lag in de hoeveelheid data: 100TB per analyse was geen uitzondering.
Het systeem was gebouwd in een productieomgeving om permanent en automatisch te draaien. Geen manuele data invoeren dus (ook nogal moeilijk met 100TB!). We organiseerden intern verschillende kennisdelingen over het resultaat, en bespraken het succes & verbeterpunten met de business owners, data owners, business analisten en applicatieontwikkelaars.
De complexiteit van analyses werd met een factor tien verminderd. Analyses gaan nu sneller, geven consistentere resultaten en de externe tool is niet meer nodig (kostenbesparing). Business users kunnen zelf aan de slag met inzichten uit de data.
Maar, bol blijft bol. Engineers at heart zijn ze ondertussen al weer verder. Waar het systeem Adobe Analytics ruimte maakte voor een in-house ontwikkelde Apache Kafka oplossing, maakte deze recent weer ruimte voor Rudderstack. Zo zie je maar, data is nooit klaar.
Elke organisatie heeft data. Allicht zit er in jouw data ook een baanbrekende innovatie. In deze case praatten we over analyse van gebruikersgedrag op een e-commerce platform. Heb jij een vraag, of wil je inzicht in je salesproces? Met inzicht vanuit data kan je meer doen. Contact us today.
ING zet als bank in op gelijke kansen en gelijke rechten. Ze willen de genderloonkloof (GPG) beter meten en aanpakken. Ze maakten een proof of concept voor het bereken van de GPG, en wilden een verbeterde variant van hun GPG tool. De jaarlijkse script-gebaseerde tool was onvoldoende flexibel en niet altijd betrouwbaar. Het doel was een robuuste en gebruiksvriendelijke analysetool te ontwikkelen die sneller en nauwkeuriger inzichten biedt.
We identificeerden samen met de business owner de toegevoegde waarde voor ING om te investeren in het identificeren en oplossen van gender pay gap. We bekeken de huidige tool, en identificeerden noodzakelijke verbeteringen zoals het creëren van een directe databaseverbinding, het valideren en opschonen van data, en het verbeteren van statistische analyse om accurate en bruikbare inzichten te garanderen.
Samen met het HR Analytics-team identificeerden we de use-cases en maakten het systeem modulair, met duidelijke componenten en robuuste analysemogelijkheden. We bekeken nieuwe statistische methodes om de analyse te verbeteren, en tekenden uit welke noden er in de toekomst nog zouden zijn.
We herschreven het script naar een object-oriented variant, pasten best practices toe zoals logging en hypothesetesten, en documenteerde ons hele proces. Zo werd de tool betrouwbaar, gemakkelijk te gebruiken en breidden we de functionaliteit uit met hypothese-testing. Hierdoor kon HR-analytics verschillende simulaties berekenen van wat de ultieme manier is om de gender pay gap te reduceren.
Het nieuwe systeem ondersteunt command-line opties voor hypothesetesten en we maakten enkele dashboards in Power BI. Door de modulaire en object-oriented structuur is het aanpassen, onderhouden en hypothesetesten significant gemakkelijker en sneller, waardoor kennis en beheer duidelijk zijn voor de toekomst.
The new tool reduced analysis time from weeks to just a few minutes, allowing gender pay differences to be identified faster and more accurately. Analyses are more flexible and consistent, making the tool easier to use. This supports ING in actively promoting gender equality and transparency. Learn more in the gender pay gap analysis, and in the ING annual reports.
Dit project sluit aan bij onze missie ‘Data voor een betere toekomst’ door gendergelijkheid op de werkvloer te bevorderen. Het draagt bij aan een eerlijkere en transparantere werkomgeving, wat een belangrijk onderdeel is van bredere maatschappelijke vooruitgang en duurzame bedrijfsvoering.
Elke organisatie heeft data. Allicht zit er in jouw data ook een baanbrekende innovatie. In deze case praatten we over data science en statistische analyse op HR-data in een multinational. Heb jij een statistische vraag, of wil je inzicht in je HR beleid? Met inzicht vanuit data kan je meer doen. Contacteer ons nu. Contact us today.
ASML maakt waanzinnige machines, ook wel “scanners” genoemd. Deze machines produceren wafers, het kernproduct in de halfgeleiderproductie. ASML wilde beter inzicht krijgen in de prestaties van deze machines om een nieuw type servicecontract te ondersteunen.
Het idee is simpel: meer performantie = meer “wafers” (het product wat de machines van ASML produceren) = klant betaalt meer. Met dit slimme model wilt ASML de belangen van de klant en die van het bedrijf op 1 lijn leggen.
Wat is performantie? We verbinden de “uptime” van de machine met de “productivity“ van de machine. Historisch werd dit manueel verbonden. De expert met meer dan 20 jaar ervaring in performantie-tuning van deze complexe machines deed dit manueel. Om inzicht op performantie over heel de vloot te doen, moet je het automatisch doen.
Samen met de domeinexpert definieerden we wat er nu écht belangrijk is om de performantie van een machine te bepalen. We identificeerden hoe “uptime” en “productivity” hand in hand gaan en welke databronnen dit beschrijven. We bepaalden wat de expert nodig had om zijn analyse te doen, hoeveel tijd en effort hij hier voor nodig had en hoeveel hij er per jaar kon doen. Dit gaf een duidelijk beeld van de complexiteit én businesswaarde nog voor we begonnen aan de implementatie van deze oplossing.
We tekenden uit hoe de verschillende databronnen samen konden worden gevoegd tot een coherent geheel. Zo’n machine schrijft gemakkelijk enkele honderden gigabytes per jaar, dus het is essentieel om de spreekwoordelijke naald in de hooiberg te identificeren. Vervolgens bekeken we welke datamodellen het beste passen om het doel van performantie-inzichten te bereiken. We ontwikkelden modulaire en schaalbare dataproducten, waarbij ruwe eventlogs werden omgezet in relevante datasets om de prestaties van scanners te verbeteren.
In een initiële variant, de Proof of Concept, gaven we aan dat dit absoluut impact had: we konden de tijd voor analyse verminderen van enkele weken naar enkele dagen. Vervolgens breidden we het proof of concept uit naar een minimum viable product (MVP). In dit MVP kon je performantie van de gehele vloot zien, iets ongekend voor ASML. We presenteerden dit enkele keren op VP/EVP niveau in de organisatie. We voegden toe wat de reden is voor verminderde performantie, waarmee root cause-analyses en prestatieoptimalisatie mogelijk werden. Hierdoor konden senior leiders en engineeringteams productiviteitsproblemen snel identificeren en aanpakken. We doopten de tool “Where are my Wafers”, omdat het exact dat doet: het geeft een inzicht in de performantie van het systeem én geeft aan waar je kan verbeteren. Tenslotte werden vloot-brede inzichten ook mogelijk. Doet één klant het beter dan de andere? Waarom?
Het systeem werd gebouwd op Azure Databricks en Apache Spark. We bouwden “trusted datasets”, iets wat ASML introduceerde om een gedeelde datafundering te garanderen binnen de organisatie, en waardoor data governance en security op een hoog niveau kan worden toegepast. Het systeem werd volautomatisch, schaalbaar en flexibel ingericht, met duidelijke kennisoverdracht en governance om langdurig succes te ondersteunen.
Het project verkortte de tijd om prestatieverbeteringen te identificeren op klantlocaties van zes weken naar minder dan één dag. Dit maakt hooggekwalificeerde experts vrij voor andere belangrijke taken en ondersteunt het nieuwe businessmodel van productiviteitsgerichte servicecontracten.
Het geschatte extra jaarlijkse rendement van dit contracttype bedraagt 150 miljoen euro, wat een waanzinnige financiële impact laat zien. Bovendien draagt het optimaliseren van scannerprestaties bij aan technologische vooruitgang en innovatie.
Dit project sluit aan bij onze missie “Data voor een betere toekomst” door de efficiëntie en productiviteit in de halfgeleiderproductie te verbeteren, wat essentieel is voor technologische en maatschappelijke vooruitgang.
Elke organisatie heeft data. Allicht zit er in jouw data ook een baanbrekende innovatie. In deze case praatten we over vloot-brede inzichten op data verspreid over een heleboel machines en datapunten. Heb jij een productiefabriek, of verkoop je B2C producten die data terugsturen naar jullie centrale systeem? Met inzicht vanuit jouw “birds-eye-view” kan je meer doen. Contacteer ons nu.
In this case, we created fleet-wide insights from data coming from many machines and data sources. Do you run a production factory? Or do your products send data back to a central system?
With the right bird’s-eye view of your data, you can discover new opportunities and improvements.
Contact us to learn more.