Internet barst van de artikelen die het einde van de data-scientists voorspellen. Niet prettig om te lezen als je in deze sector werkzaam bent. De reden voor de ophef is de opmars van automated machine learning (auto-ml) dat een deel van de werkzaamheden van datawetenschappers zal automatiseren. Een dagelijkse werkdag zal er voor een hen in 2025 waarschijnlijk anders uitzien dan vandaag de dag. Dat neemt niet weg dat er meer dan voldoende vraag blijft naar deze specialisten.
Voor het succesvol inzetten van ai in een organisatie is niet alleen de juiste technologie van belang. Ook het personeelsbestand moet zo zijn uitgerust om alle processen, methodes en technologieën in hun dagelijkse werkzaamheden te gebruiken. Er moeten mensen zijn die de zogeheten ‘democratisering van data’ binnen een organisatie begeleiden, die voldoende kennis, know-how en expertise hebben om het gebruik van data in goede banen te leiden.
Daarnaast moet een data-scientist die met een rommelige dataset werkt soms beslissingen maken waarvoor materiekennis nodig is. Kennis die een machine niet heeft. Hoewel er ai-tools zijn die auto-ml aanbieden voor zaken als feature engineering, modeltraining, implementatie en monitoring, zijn er nog steeds data-scientist nodig die met de business in gesprek gaan over de rechtvaardiging van bepaalde use cases, overleggen over behaalde inzichten en pleitbezorger zijn voor de waarde die een model kan leveren. Dit noemen we ook wel de ‘human-in-the-loop’.
Vreedzame co-existentie
In een Engelstalige blog las ik het volgende citaat: ‘je afvragen of auto-ml beter functioneert dan machine-learning gebouwd door een mens, is hetzelfde als een 3D-printer vergelijken met een beeldhouwer met een masterdiploma’. Oftewel, het gaat er maar net om waar de menselijke denkkracht of auto-ml wordt ingezet. Om een voorbeeld te geven, met auto-ml kunnen zaken als data voorbereiden en opschonen worden geautomatiseerd en features sneller en zonder handmatige fouten worden toegevoegd.
Je zou auto-ml kunnen beschouwen als een versneller van het potentieel van een data-scientist. In plaats van weken aan een model te werken, zullen de data-scientists zich meer bezig gaan houden met advisering over hoe organisaties hun doelstellingen kunnen behalen met onder andere auto-ml en andere data-tools. Daarnaast kijken data-scientist met een andere bril naar de resultaten dan een machine, omdat ze meer oog hebben voor nuance. De ene keer is er, zoals het citaat zegt, behoefte aan het kunstenaarsoog van de beeldhouwer en de volgende keer is een druk op de knop van de 3d-printer voldoende.
Tijd voor belangrijk werk
Data-scientist besteden zo’n tachtig procent van hun tijd aan repetitieve taken, zoals het opschonen en organiseren van data. Het kan dus zeker geen kwaad om wat van die saaie stappen in de pijplijn van data-naar-inzicht te automatiseren. Met auto-ml besparen data-scientist veel tijd, die ze kunnen besteden aan andere projecten met meer impact. De taakomschrijving van een data-scientist bestaat vaak uit meer dan alleen het modelleren. Denk aan het interpreteren van de resultaten en het communiceren van belangrijke uitkomsten. Als er minder tijd gaat zitten in de kleine details bij het bouwen van modellen, zal niet alleen de data-scientist tevreden zijn over zijn werk, maar neemt ook de productiviteit van het team toe.
Het is – en dat zal niemand verrassen – zeker niet het einde van de data-scientist. Ook niet door de opkomst van auto-ml. Veel eerder geloof ik dat de functie nog steeds ‘the sexiest job of the 21st century’ blijft, zoals Krishna Kumar stelt in Entrepreneur.