Data zijn het levensbloed van elk bedrijf dat concurrentievoordeel wil behalen. Dat is makkelijker gezegd dan gedaan, want veel bedrijven worstelen nog om optimale waarde uit hun data te halen. Om dat te doen, moet de 'kleine' data-organisatie eerst groot worden.
Wat bedoelen we met een ‘volwassen’ data-organisatie? De mate van volwassenheid is af te lezen uit hoe goed een organisatie data beheert, analyseert en gebruikt voor geavanceerde forecasting. Uiteindelijk bepaalt de mate van volwassenheid ook hoe efficiënt data zijn in te zetten voor bedrijfsgroei, waarbij niet alleen prestaties worden geanalyseerd, maar ook ontwikkelingen worden voorspeld.
Het groeiproces naar een volwassen data-organisatie heeft verschillende stappen. Je kunt niet simpelweg met je vingers knippen en – voilà – datagestuurd zijn. Binnen onvolwassen organisaties wordt het potentieel van data niet benut omdat er slechts oppervlakkig naar wordt gekeken. Vaak ligt dat aan een gebrek van besef van de mogelijkheden die geïntegreerd datagebruik kan bieden. Hierdoor zijn ook processen niet optimaal ingericht. Data leeft vaak in afzonderlijke systemen en rapportages worden nog te vaak handmatig aangemaakt, waardoor efficiënte forecasting niet mogelijk is.
Organisaties met een meer geavanceerde benadering, gebruiken daarentegen ai en data-science om processen te optimaliseren en voorspellingen te doen. Dit levert waardevolle inzichten op die de concurrentiepositie aanzienlijk kunnen verbeteren.
In essentie beweegt een volwassen wordende data-organisatie dus van ‘wijsheid achteraf’ naar ‘een vooruitziende blik’.
Opvoeding
Data zijn niets zonder de toolkit waarmee je ze kan analyseren. Absoluut cruciaal is de onderlaag waarop deze tooling draait. Laten we het zo stellen: zonder goed fundament kun je geen huis bouwen.
Maar veel organisaties worstelen met die onderlaag, waardoor het vele malen lastiger wordt om optimaal met data te werken. Een groot obstakel is de kloof tussen twee moeilijk te verenigen architecturen. Aan de ene kant van deze kloof vind je datawarehouses en business intelligence-tools (bi) voor data-analisten. Aan de andere kant staan data-lakes en ai-technologieën voor data-scientists. Je kunt deze kloof overbruggen met eigen data-pipelines, maar dit kan meerdere problemen opleveren, zoals een dubbele data-boekhouding waarbij data constant gedupliceerd of overgeheveld wordt, hoge kosten vanwege de tweeledige datawarehouse/data lake-architectuur die je moet onderhouden en inefficiëntie in data governance.
De oplossing is daarom niet om de kloof te overbruggen, maar deze te dichten. Een volwassen data-organisatie moet gebouwd worden op een nieuwe data-lakehouse-architectuur, die de beste aspecten van datawarehouses en data-lakes combineert om een gecentraliseerde, eenduidige oplossing te bieden voor alle belangrijke data-activiteiten en uiteenlopende use cases ondersteunt van bi tot ai. Deze noodzaak wordt erkend door cio’s, die volgens een recent MIT-onderzoek de implementatie van een verenigd dataplatform als prioriteit stellen.
Toekomstbestendig
Het ene platform is het andere niet. Naast de keuze tussen warehouse, lake of lakehouse zijn er verschillende factoren die datavolwassenheid verder helpen of juist tegenwerken. Bovendien moet een dataplatform toekomstbestendig zijn, zodat je toekomstige innovaties kan bijbenen. Denk aan ai en wat dat zal vereisen aan capaciteit, expertise en procesverandering. Om aan de vereisten van de toekomst te voldoen, moet een platform aan enkele voorwaarden voldoen.
Zo moet een platform open zijn, zodat organisaties gebruik kunnen maken van externe data, kennis en tooling. De opensource-gemeenschap speelt een steeds grotere rol in softwareontwikkeling en zeker op het vlak van ai kunnen organisaties daar eigenlijk niet meer omheen.
Verder is het verstandig om multi-cloud-omgevingen te ondersteunen – niet alleen om de kans op vendor lock-in te minimaliseren, maar ook vanwege de extra flexibiliteit om de tech-stacks naar wens in te richten.
Dataplatforms moeten data ook toegankelijk maken voor de bredere organisatie. Het is een simpele rekensom: hoe meer werknemers met data en algoritmen aan de slag kunnen, hoe meer kans dat innovatietrajecten slagen. Naarmate tooling steeds simpeler wordt, kun je veel meer werknemers met data laten werken. En dat is zeker gezien de krappe it-arbeidsmarkt geen overbodige luxe.
Datacultuur
Een volwassen data-organisatie investeert niet alleen in de juiste data-architectuur, maar ook in een datacultuur. Die cultuur steunt op drie pijlers: mens, proces en technologie. Wat betreft personeel moet iedere persoon in de organisatie de juiste toegang hebben tot de juiste data op het juiste moment.
Vanuit een procesperspectief vereist dit een herziening van de interne processen en governancemodellen. Bovendien moeten bedrijven kaders creëren die consistent data centraal stellen binnen deze processen. Mensen moeten feedback kunnen geven om de manieren te verbeteren waarop nieuwe data wordt gecreëerd en verzameld. De technologie moet een eenvoudig, open en toekomstbestendig platform bieden, zoals een data-lakehouse dus, dat iedereen in de organisatie in staat stelt op een fijne en productieve wijze met de data te werken.
Altijd goed om te lezen dat mensen en processen voor technologie komen want data dient een doel als we kijken naar de DIKW piramide. Want essentie van een volwassen wordende data-organisatie gaat niet om de wijsheid achteraf naar een vooruitziende blik maar om alle lessen die in het proces geleerd worden. Topje van de berg data gaat tenslotte om de wijsheid die je eruit kunt halen want de ervaring leert dat er maar twee zekerheden in het leven zijn en de rest een gok is.
De waarschuwing op beleggingsproducten dat resultaten uit het verleden geen garanties geven voor de toekomst zegt iets over de vooruitziende blik. Wat betreft de kristallen bollen van voorspellen op basis van modellen is het tenslotte steeds vaker liegen met statistiek. En wat betreft de feedback van het onderbuik gevoel staan de algoritmen steeds vaker in het beklaagdenbankje omdat mensen meer rechten hebben dan technologie.
WC-eend van Databricks adviseert een datalake(house) maar deze term vult nog niet de eisen van governance in zoals de feedback die mensen hebben aangaande hun persoonsgegevens. En verder hebben we nog de kwaliteit van data, de juiste data op het juiste moment gaat veelal om informatie voor het nemen van beslissingen. Gemanipuleerd of geïnformeerd is het voortschrijdende inzicht de wijsheid achteraf.