Het toepassen van datascience roept het beeld op van de kip met de gouden eieren. Verzamel data, laat de analyticssoftware het werk doen en profiteer direct van de resultaten. De gouden eieren zijn een hogere winst, een reductie van het aantal fraudegevallen of het detecteren van bottlenecks binnen bedrijfsprocessen. Maar net zoals de kip met gouden eieren niet bestaan, zo weerbarstig is de praktijk. Meer, het toepassen van datascience staat in de kinderschoenen – en veel organisaties worstelen met de vraag hoe meer waarde te creëren op basis van hun data.
Om de kippenvergelijking verder door te trekken, ook bij datascience kun je je afvragen wat er eerst moet zijn: de kip of het ei? Moet je als organisatie op zoek naar de businesscase of moet er eerst aandacht besteed worden aan de beschikbare data en de wijze waarop data verzameld worden?
Veel organisaties denken wel na over de mogelijkheden van geavanceerde data-analyses, maar slagen er nog niet om die al toe te passen. Zij realiseren zich dat de hoeveelheid beschikbare data jaar na jaar exponentieel toeneemt en dat zij hier iets mee moeten doen. Vaak weten zij zich echter nu al geen raad met de beschikbare data en zijn ze bang dat ze in de toekomst helemaal door de bomen het bos niet meer zien.
Daarom is het van belang dat organisaties nu aan de slag gaan met het creëren van een goede basis voor de inzet van datascience, machine-learning en artificial intelligence zodat zij straks niet achterop raken bij de concurrentie. Hiervoor moeten zij op strategisch niveau nadenken over de toepasbaarheid van datascience binnen de organisatie en welke operationele aanpassingen er nodig zijn
Waardevolle data
Dat data-analyse waardevolle inzichten kan opleveren, daar is iedereen het over eens. Maar bepalen wat waardevolle data is en hoe deze data vervolgens zijn in te zetten, blijkt complexer. De data waarover organisaties zelf beschikken, worden doorgaans niet verzameld om voorspellingen te doen, maar dienen meestal een specifiek bedrijfsproces. Denk aan het verzamelen van de benodigde informatie om een polis af te sluiten; deze data heeft wel een voorspellend karakter, maar dit is zeer beperkt.
De waarde van de interne data neemt exponentieel toe wanneer er een koppeling plaatsvindt met data die extern beschikbaar zijn. Zo kan een verzekeringsmaatschappij beschikken over interne data die zijn opgeslagen over de polisinformatie. Dit geeft inzicht in wie de klant is op basis van enkele standaardkarakteristieken, zoals NAW-gegevens, geboortedatum en klanthistorie. Met deze gegevens is het alleen lastig om uitgebreid te segmenteren en hierdoor is er onvoldoende inzicht om bijvoorbeeld te voorspellen of bepaalde klanten loyaal en of winstgevend zullen zijn of juist een hoog claimgehalte hebben.
Er zijn dus meer data nodig en uit onderzoek blijkt dat wanneer interne data bijvoorbeeld gecombineerd worden met data verkregen van sociale-mediaplatformen – zoals Facebook of Instagram of openbare bronnen zoals het CBS – er veel meer relevante inzichten zijn te verkrijgen om de klantprofielen te verrijken. Zonder gebruik te maken van data van derden is het lastig om echt onderscheid te maken tussen een loyale en niet-loyale klant. Door de sociale data toe te voegen, komen daar variabelen bij zoals vrijetijdsbesteding (actief bij de voetbalclub of hockeyclub?) en voorkeuren (vakanties naar exotische bestemmingen of een weekendje in eigen land?). Deze variabelen maken het eenvoudiger om nauwkeuriger te segmenteren en dit stelt de organisatie in staat om bijvoorbeeld succesvoller met doelgerichte marketingcampagnes te zijn.
Machine-learning
De opkomst van machine-learning zorgt ervoor dat het opschonen van beschikbare data in een stroomversnelling raakt. Enerzijds wil je als organisatie dat de beschikbare data geoptimaliseerd zijn voor machine-learning en anderzijds zorgt machine-learning ervoor dat de datakwaliteit toeneemt. Op basis van het machine-learningalgoritme zijn data beter te identificeren en dit helpt ook om vervuiling van data op te sporen en tegen te gaan. De praktijk leert dat beschikbare data altijd vervuild zijn. Hoe omvangrijk die vervuiling is, is vaak onbekend.
Voor het ontwikkelen van algoritmes geldt over het algemeen dat de kwaliteit van de voorspellingen hoger wordt naarmate er meer data beschikbaar zijn. Het is wel van belang om goed in de gaten te houden hoe de data gedefinieerd worden. Als er recent bijvoorbeeld nieuwe softwarereleases zijn doorgevoerd, dan kan dit gevolgen hebben voor de wijze waarop data zijn opgeslagen of hoe de klant door de website klikt. Hierdoor kan een algoritme tot verkeerde conclusies komen. Algoritmes zijn zo slim als de data die worden toegevoegd. Het is daarom belangrijk om hier als organisatie scherp op te blijven.
CDO
Om de adoptie van datascience binnen een organisatie in goede banen te leiden, is er een groeiende behoefte aan een chief data officer (CDO). Zeker nu veel organisaties aan het begin van het proces staan, is er behoefte aan expertise en sturing.
Een cdo bepaalt welke data worden opgeslagen en op welke wijze dit gebeurt. Daarnaast ziet hij toe op de beveiliging van gegevens. Het bewaken van definities alsmede reguleren van het gebruik van de data binnen de wettelijke kaders zijn eveneens taken die hem toehoren.
Het aanstellen van een cdo maakt binnen de organisatie bovendien duidelijk wat het belang van data is en zorgt voor het benodigde draagvlak om datagedreven te werken.
Er zijn binnen de meeste organisaties nog voldoende stappen te zetten voordat machine-learning, kunstmatige intelligentie en datascience common practice zijn. Organisaties die op zoek zijn naar de kip met de gouden eieren doen er goed aan eerst kritisch te kijken naar de voederbak en het hok. Quick wins zijn leuk, maar echte resultaten worden behaald met een duurzame en toekomstgerichte datastrategie.
Henk Brands, businessunitmanager Data Solutions bij Info Support
“Zij realiseren zich dat de hoeveelheid beschikbare data jaar na jaar exponentieel toeneemt en dat zij hier iets mee moeten doen”
Dat doet me denken aan mijn zolder. Hard nodig om die rommel eens weg te gooien. Wordt waarschijnlijk weer wachten tot verhuizing. Heet dat niet reorganisatie ? O nee, das als er mensen uit moeten. Goed, wachten op migratie dan.