Het lijkt een logische, eerste stap bij digitale projecten om in de technologie te duiken en een dataplatform te kiezen. Dat is waar de data terecht moeten komen, nietwaar? Data moeten in een data lake worden gepompt of worden opgeslagen in een datawarehouse en door een data-pijplijn stromen. Allemaal waar, en zeker nodig. Toch is dit niet de plek waar je je reis wilt beginnen.
Laten we vaststellen waarom het een goed idee is juist níét te beginnen bij het platform. Maak je daarbij geen zorgen, je mag uiteindelijk heus wel zwemmen in je data lake, maar begin eerst eens met pootjebaden.
Hieronder de zes stappen die je (nog) moet zetten alvorens te starten met de keuze en inrichting van een dataplatform.
1. Je hebt (nog) niet genoeg gepraat
Je data-reis beginnen met het platform is de meest uitdagende eerste stap die je kunt zetten. Dataplatformen komen in zoveel vormen en maten dat het lastig is om zelfs maar op te schrijven aan welke vooraarden moet worden voldaan.
De beste route is om andersom te beginnen. Praat met collega’s in je organisatie die al bezig zijn inzichten te verkrijgen uit data. Het zal je verrassen wie deze personen zijn en wat zij al doen met data. Het kan de engineer zijn die producten ontwerpt en gebruikerspatronen van klanten onder ogen heeft gekregen. Of de supply-chain-stagiair die een analyse doet van de fabrieksvloer om te achterhalen waar het knelpunt zit. Of de marketeer die clicks in de webshop omzet naar waardevolle inzichten?.
Zij kunnen uitleggen hoe ze vandaag de dag waarde creëren met data en, belangrijker nog, die de volgende stap kennen. Voor de engineer betekent dat nóg meer databronnen toevoegen aan de vergelijking. De stagiair mist wellicht nog de connectie met het datasysteem van je fabriek. De marketeer zoekt het mogelijk in manieren om beschikbare data te verbinden met een deep learning-toolkit. Zulke verhalen helpen je begrijpen wat de business nodig heeft en doen je inzien hoe een dataplatform zichzelf terugverdient.
2. Je weet (nog) niet waar de data vandaan komt
In gesprek gaan met mensen die al bezig zijn met data geeft je inzicht in waar de data vandaan komen. Wat sowieso aan bod zal komen, is de complexiteit van het verzamelen van data en het combineren en transformeren ervan in een bruikbare vorm om analyses op te draaien. Dat is de volgende stap in de reis: begrijpen wat je nodig hebt van een dataplatform.
Dataverzameling is een moeilijk spel. Databronnen zijn verspreid in de organisatie. Het helpt te weten welke bronnen met elkaar moeten worden verbonden. Kan het platform dit voor elkaar krijgen over de grenzen van je organisatie heen, zoals verschillende netwerken, stacks, vendoren, locaties of datacenters? Deze informatie helpt om de requirements van een dataplatform duidelijk te krijgen. Voor sommigen is een cloudoplossing geschikt, voor anderen is het beter een dataplatform dichter bij huis te hebben, zoals in het eigen datacenter.
3. Je weet (nog) niet hoe data wordt verwerkt
Dataplatformen zijn meer dan grote silo’s van bits en bytes. Als je een platform wilt dat op de lange termijn waarde oplevert, is daar veel rekenkracht en opslagcapaciteit voor nodig. Door te achterhalen en begrijpen wat je organisatie op dit moment al doet en in de toekomst zou willen doen, krijg je een beter beeld van de benodigde capaciteit.
De initiële businesswaarde die data opleveren, zit vaak in eenvoudige visualisaties en dashboards. Door te luisteren naar de verhalen van mensen die al met data bezig zijn, doe je nieuwe inzichten op. Stel je voor dat de engineer die de producten van de toekomst bouwt, gebruikmaakt van specifieke natuurkundige of mechanische modellen die ook moeten worden opgenomen in het platform. Of dat de stagiair image-data nodig heeft. Dat de marketeer die deep learning-technieken echt wil gaan gebruiken. Dit alles heeft invloed op de rekenkracht die het platform nodig heeft.
Door deze zaken vooraf mee te nemen in de platformarchitectuur, verminder je de kans om bochten – en daarmee toekomstige wegen – af te snijden.
4. Je weet (nog) niet hoe je data bruikbaar kunt maken
Een dataplatform an sich is niet het doel. Het doel is inzichten uit data bruikbaar te maken en te integreren in dagelijkse bedrijfsprocessen. Het doel is inzichten te leveren aan klanten of de supply chain te verbeteren. De manieren om die inzichten te embedden in de organisatie stellen ook weer andere eisen aan het platform.
Is er een mobiele app nodig die data beschikbaar stelt aan het logistieke personeel? Of moet het management tevreden worden gesteld met realtime-scenarioplanning, of met vraag- en aanbodkarakteristieken van de business?
In het eerste voorbeeld is het noodzakelijk dat het ontwikkelteam data beschikbaar kan stellen door middel van microservices vanuit traditionele databases. In het laatste voorbeeld moeten de applicatie-data in milliseconden worden uitgelezen en verwerkt. Kan je nieuwe platform dat leveren?
5. Je weet (nog) niet hoe je het operationeel maakt
Aan het begin van de reis lijkt het leveren van oplossingen in een productieomgeving nog ver weg. Maar al snel, wanneer je succesvolle use-cases hebt ontdekt, zal de business dagelijkse continuïteit eisen. Daardoor leer je dat een platform niet alleen bestaat uit data en rekenkracht. Het heeft mensen nodig om het te draaien en in de gaten te houden: om de datastromen te industrialiseren. Beschik je op dit moment over de mensen die issues kunnen oplossen bij het invoeren van data? Wie gaat de apps updaten wanneer het logistieke personeel nieuwe features nodig heeft?
Het dataplatform vraagt om een nieuwe aanpak van een nieuw team collega’s met nieuwe vaardigheden en expertise. Je wilt er zeker van zijn dat het team met het platform meegroeit. Maak de teamleden onderdeel van het beslissingsproces en train hen in nieuwe mogelijkheden. Zet hen dicht naast de collega’s die al waarde aan het creëren zijn en leer hen de taal van de business begrijpen. Zo wordt het dataplatformteam geïntegreerd met de business en gezien als waardevolle partner om inzichten en waarde te creëren.
6. Je hebt (nog) geen businesscase
Misschien wist je het al: dataplatformen zijn niet goedkoop. Om de businesscase te bouwen voor een dataplatform nog voordat je waarde hebt gecreëerd, wordt een uitdaging. Door het aan te pakken op de manier die hier wordt geschetst, is de behoefte aan een dataplatform gemakkelijk uit te leggen aan de hand van businesswaarde die is gecreëerd. Daarnaast zal de business proactief vragen naar de operationalisatie van data en is ook de terugverdientijd eenvoudig aan te tonen.
Dus wanneer je begint met je data-reis: begin klein, praat met betrokkenen, experimenteer en fail fast. Werk met enthousiaste experts die je bij elke stap kunnen helpen en blijf agile. Alleen dan zal je het dataplatform vinden dat bij je past. Je gaat er sowieso een nodig hebben. Het is alleen niet de eerste stap.
Iedere organisatie heeft een dataplatform nodig omdat ze data aanmaken, verwerken en bewaren. Maar of dat plaform een data lake, een bescheiden vijvertje of een moeras moet zijn is een vraag die de auteur uiteindelijk niet beantwoord met haar 6 stappen.