Het is niet meer dan duidelijk dat het benutten van data en machine learning (ml) bedrijven helpt bij het genereren van meer waarde. Toch blijkt uit onderzoek van McKinsey dat slechts 20 procent van alle bedrijven gebruikmaakt van machine learning in productie. Waardoor we ons kunnen afvragen: waarom is de overige 80 procent niet in staat om succesvol machine learning naar productie te brengen?
Als machine learning-specialist werk ik met veel organisaties samen om machine learning naar productie te brengen. Veelal zie ik dezelfde zaken fout gaan. Sta je als bedrijf op het punt om je in de wereld van machine learning te begeven? Wees dan alert op een aantal valkuilen.
Geen strategie
Veel organisaties zien het toepassen van kunstmatige intelligentie als iets wat ze naast hun dagelijkse werkzaamheden kunnen doen. Je huurt een aantal PhD’s in, geeft ze een hippe werkomgeving en je bent klaar… toch? Helaas is dit niet hoe het werkt. Het runnen van een datagedreven organisatie of het hebben van een ‘ai first’ aanpak vraagt om een bedrijfsbrede ai-strategie.
Het ontwikkelen van een goede strategie legt men niet even uit in een paar zinnen. Wel zien we twee elementen die vaak terugkomen bij bedrijven met een succesvolle strategie. Ten eerste dient deze strategie vanuit de c-suite en management gesteund te worden. Zonder deze steun is het lastig om echt een ‘ai first’ aanpak te hebben. Ten tweede is het belangrijk dat wordt nagedacht over de ‘wat’ en de ‘hoe’. Wat wil je bereiken en hoe gaan we dit resultaat realiseren? We zien nog te vaak dat er alleen over de ‘wat’ vraag wordt nagedacht en dat die vaak is ingevuld met: ‘We willen meer ai toepassen.’
Ver van bedrijfsdoelstellingen
Een veel voorkomende uitdaging voor machine learning-teams is dat ze moeite hebben met het creëren van business impact. Deze teams zijn vaak zeer technisch onderlegd. Doordat machine learning (ml) door het bedrijfsleven nog vaak wordt gezien als iets ‘magisch’, krijgen deze teams veel vrijheid. Fijn voor de data scientist, die helemaal los kan gaan, maar niet per se gunstig voor de business impact.
Bij bedrijven die succesvol ml toepassen zien we vaak twee zaken terugkomen. Ten eerste worden ml-teams gekoppeld aan business units of -doelstellingen. Deze teams delen dan een gezamenlijk einddoel: het genereren van business impact. Bij Google noemen we dit een ‘shared okr’ (objectives and key results) ofwel een gedeelde doelstelling – in dit geval tussen de business en de ml-teams. Ten tweede ligt de regie binnen de projecten vaak meer bij de business. Laten we niet vergeten dat machine learning nooit een doel op zichzelf moet zijn – tenzij je onderzoek doet.
Verkeerde platform
Bedrijven zijn vaak in de veronderstelling dat hun huidige on-premise (legacy) systemen prima compatibel zijn met de ‘nieuwe wereld’. Maar de quote ‘What got you here will not get you there’ (Marshall Goldsmith) blijkt niet voor niets een klassieker. Machine learning vraagt veel flexibiliteit, schaalbaarheid en openheid om te kunnen slagen. In de praktijk zitten ml-teams bij enterprise organisaties vaak onnodig lang te wachten op zaken als toegang tot data, nieuwe hardware en software-updates. Iets waar ik niet blij van zou worden als cio.
Wil je als organisatie voorop lopen op het gebied van machine learning, dan heb je dus een flexibel, schaalbaar en open platform nodig. Hierdoor kun je als organisatie beter gebruik maken van de snelle ontwikkelingen op gebied van machine learning. Zo’n platform biedt ook de mogelijkheid om ml-componenten, zoals data en modellen, gemakkelijk te delen.
Het bekende wiel
Een andere grote uitdaging bij het toepassen van ml is het vinden van een goed beginpunt. Maar al te vaak ligt dit beginpunt bij nul – dat is natuurlijk niet elke keer nodig. Dit heeft onder andere een negatief effect op je time to value. Een aantal veel voorkomende voorbeelden hiervan zijn: het genereren van nieuwe features; het optuigen van een nieuwe infrastructuur; niet kijken naar eerder gemaakte fouten; en het niet hergebruiken van getrainde modellen;
Nu stel ik niet dat je nooit meer nieuwe features moet genereren of nieuwe modellen mag trainen. Wel moet je als organisatie beter nadenken over hoe je technologie en kennis beter kan hergebruiken. Waarom zou je bijvoorbeeld nieuwe features willen genereren als je goede features van een ander project of team kunt hergebruiken? En waarom zou je een image classificatiemodel ontwikkelen als je een Automl of TF-hub model kunt gebruiken? Het succesvol starten van een ml-project begint met het hergebruiken van ml-componenten, zoals data, modellen en api’s. Daarnaast is het belangrijk dat teams ervaring en kennis zoveel mogelijk delen.
Conclusie
We hebben nu gezien welke valkuilen vaak terugkomen bij organisaties die met machine learning aan de slag gaan. Als we nu deze vier valkuilen omzetten naar generieke adviezen en vervolgens naast elkaar zetten dan hebben we de start van ons ‘ai-masterplan’.
Deze bijdrage is in verkorte vorm (als column) gepubliceerd in Computable Magazine nr. 5, september 2019.