Zo goed als alle topmannen van grote bedrijven hebben datagedreven ambities, maar slechts een derde geeft aan hierin te slagen. Dit blijkt uit onderzoek van NewVantage Partners. Waarom mislukken zoveel dataprojecten? Want we laten bij de vleet proefballonnen op, maar die komen kennelijk nauwelijks in productie.
Dat er weinig van de grond komt, is te wijten aan de gebrekkige manier waarop data-trajecten zijn ingericht. In dit artikel laat ik zien waar je in het bijzonder op moet letten om wél succesvol te zijn met datascience-projecten.
De behoorlijke discrepantie tussen het aantal dataprojecten dat wordt gestart en dat daadwerkelijk meetbaar resultaat oplevert, wordt goed geïllustreerd door bijgaande grafiek. En dit is nog een vrij optimistische weergave, want volgens cijfers van Gartner faalt zelfs 85 procent van de dataprojecten. En uit recent onderzoek van PWC blijkt dat zelfs maar vier procent van de duizenden ondervraagde bedrijven aangeeft met succes een ai-oplossing te hebben geïmplementeerd.
De ervaring is: als het fout gaat, ligt het vrijwel altijd aan de manier waarop het traject van het datascience-project is ingericht. Want in de cruciale fase tussen een proefballon en de implementatie van een duurzame oplossing gaat het vaak mis. De gouden route (zie afbeelding hieronder) die loopt van goed idee naar een briljante softwaretoepassing waar je hele organisatie blij mee is en de vruchten van plukt, heeft een aantal tussenstappen die je simpelweg niet mag overslaan. Bij elke tussenstap zijn er verschillende vaardigheden vereist om hem te laten slagen. Je zal dus onderscheid moeten maken tussen deze verschillende tussenstappen in het traject: eerst is er een proof of concept (poc), vervolgens maak je de stap naar een eerste implementatie, een minimum viable product (mvp).
Met een poc geef je antwoord op de vraag: kunnen we het goede idee ook uitvoeren? Is het reëel? Zijn alle data aanwezig om bijvoorbeeld een chatbot antwoord te laten geven op complexe vragen? Om dit aan te tonen, gaat een klein team, bestaande uit in elk geval een data-analist en datawetenschapper, in korte tijd aan de slag om alleen maar de haalbaarheid van het idee te verifiëren.
Essentieel is dat van tevoren is gedefinieerd wanneer een poc succesvol is, maar ook dat er in deze fase niet teveel kapiteins op het schip zitten. Dan wordt de scope namelijk te groot, en zal je zien dat de belangrijke scheidslijn tussen poc en mvp vervaagt, met desastreuse gevolgen. Het is belangrijk dat je beseft dat een poc ook kan mislukken. De kwaliteit van de data kan bijvoorbeeld te wensen over laten, er kan simpelweg te weinig data beschikbaar zijn, het veronderstelde model blijkt niet te passen of de resultaten zijn te matig om er nog verder aan te trekken.
Het is prettig om daar tijdens deze fase achter te komen en niet pas later, want dan weet je waar je aan kunt gaan werken. Alle investeringen om het model te verbeteren, zijn tevergeefs als het probleem ligt bij inferieure datakwaliteit. En vice versa hebben investeringen in de datakwaliteit geen zin als het model niet blijkt te passen. Dergelijke zaken wil je in déze fase weten, en niet later.
Stap naar een mvp
De stap naar de volgende fase is cruciaal: je wil het beproefde concept nu ook echt in productie zien te krijgen. Vanaf nu verandert dan ook de manier waarop je het project benadert. Bij een poc kun je de realiteit voor een groot gedeelte negeren. Je wil weten of het kan, en de rest van de wereld interesseert je dan even niet.
Wil je een geslaagd mvp, dan is dat compleet andersom: nu moet het concept in de praktijk worden gebracht, en moet je rekening houden met bedrijfsprocessen, GDPR, security, de aansluiting op bestaande systemen en infrastructuren. Hoe gaat die chatbot bijvoorbeeld integreren in de website?
Om de stap van poc naar mvp te maken, is ook een andere skillset vereist. Zoals ik al schreef in een ander artikel met tips om de slagingskans van een datascience-project te vergroten: er is meer nodig dan alleen verstand van datascience. Business-gevoel is minstens zo belangrijk en zonder een gezonde dosis aan it-kennis ben je nergens in deze fase. Dit is bijvoorbeeld iets waar veel datascience-startups in tekort schieten en precies de reden waarom er zoveel proefballonnetjes zijn die nooit verder komen dan de poc-fase. Want zelfs als je het project in deze fase zou proberen te redden – bijvoorbeeld door één van de grote consultancybureaus in te schakelen – wordt het lastig. Dan zal je namelijk merken dat het hen juist weer aan de benodigde datascience slagkracht ontbreekt.
Rollen
In de fase na een geslaagde poc zijn er rollen weggelegd voor businessvertalers, software-engineers, dataengineers, data-architecten en datawetenschapper (zie de afbeelding). Maar er moeten ook andere afdelingen, zoals legal, compliance en it, bij het project worden betrokken. De truc is hier dat dit precies op het juiste moment gebeurt. Wanneer dat is, is per organisatie en project verschillend, maar slaag je hierin niet het juiste moment te kiezen, dan zijn de gevolgen wel overal hetzelfde. Betrek je ze te vroeg, dan kan de snelheid uit het project lopen.. En doe je het te laat, dan kunnen afdelingen zich gepasseerd voelen en gaan ze dwars liggen. De duur van de fase tussen poc en mvp hangt sterk af van de mate waarin een organisatie gewend is aan dergelijke trajecten.
Het is daarnaast essentieel dat er na de geslaagde poc een rol is weggelegd voor een zogenaamde businessvertaler, een rol die tegenwoordig steeds vaker voorkomt. Dit schaap-met-de-vijf-poten moet snappen wat er met datascience kan, maar ook in staat zijn met de business te praten, en dat weer naar it- en softwareontwikkeling kunnen vertalen.
Echte werk
Dan is het zover,de eerste versie van het dataproject is live. De chatbot staat op de site, en kan wellicht nog niet op alle vragen antwoorden, maar dat komt later wel. En het allerbeste nieuws: nu de mvp geslaagd is, begint het echte werk pas. Want de echte uitdaging zit hem in het schaalbaar krijgen van de oplossing in de organisatie. Maar daarover meer in een volgend artikel.