'Heb jij een Master of PhD diploma op het gebied van datawetenschap/-science en breng jij uitstekende verbindende communicatieve vaardigheden mee? Dan zijn wij op zoek naar jou! We zoeken iemand met minstens vijf jaar ervaring, en die de weg kent in Spark, Hadoop, Hive, Pig, SQL, Python, R, Tensorflow, NLP én machine learning technieken…' Een typische vacature voor een datawetenschap. Maar is dit niet wat teveel gevraagd?
Datawetenschapper werd in 2012 door Harvard Business Review uitgeroepen tot het meest sexy beroep. Sindsdien is de populariteit van de datawetenschapper gestegen, zo laat ook Google Trends zien. Een oorzaak hiervan kan zijn dat de ontwikkelingen op het gebied van datawetenschap zo snel gaan, waardoor het tekort aan geschoolde datawetenschappers alleen maar groter en groter wordt. Met als gevolg: werkgevers zijn op zoek naar een datawetenschapper, maar kunnen deze maar lastig vinden. En werknemers willen een datawetenschapper zijn, maar hebben de kwaliteiten niet. Ook het onvermijdelijke gat tussen opleiding en arbeidsmarkt – waar de inhoud van de opleiding niet nauw genoeg aansluit op de inhoud van het bedrijfsleven – draagt niet bij aan het opvullen van dit tekort [2]. De datawetenschapper is het schaap met de vijf poten geworden. Hij moet de functie van een geheel team van ethische hackers, engineers en analisten in zijn eentje vervullen.
Inhuren of werven
Een organisatie zou zich moeten afvragen waarom zij een datawetenschapper wil inhuren of werven. Is dit louter voor een korte tijd – lees een enkel project – of is dit voor een structurele probleemvraag? Ten tweede zal een werkgever nauwkeurig moeten afbakenen over welke kwaliteiten de datawetenschapper moet beschikken. Om die vraag te beantwoorden, zal de werkgever exact moeten weten hoe de functie bekleed moet worden. Vaak wordt er door een organisaties gezocht naar een datawetenschapper die voldoet aan het volledige profiel, met zoveel kwalificaties waar niemand aan kan voldoen [2]. Hierdoor kunnen veel goede mogelijke sollicitanten afvallen.
Complex
Een andere reden wat het inhuren of werven van een datawetenschapper complex maakt, is dat de goede, ervaren datawetenschappers al zijn weggekaapt door de grote bedrijven. Welke ook nog eens een hoog salaris kunnen bieden. Volgens Paysa gaat het gros van de generatie datawetenschappers die van de universiteiten afkomt, werken voor grote bedrijven zoals Google, Microsoft of Amazon [3]. Er blijven dus maar weinig potentiële, ervaren werknemers over voor de wat minder grote bedrijven.
Senior
Een ander opmerkelijk gegeven is dat een gemiddelde senior functie al start bij drie jaar werkervaring. Om tot expert benoemd te worden, wordt bij de meeste andere senior functies toch minstens vijf jaar werkervaring verwacht. Waaruit je zou op kunnen opmaken dat óf datawetenschappers zich kwalitatief sneller ontwikkelen dan in welk ander vakgebied dan ook. Óf dat door het tekort aan ervaren datawetenschappers de functie-eisen naar beneden zijn gesteld. De laatste lijkt meer plausibel.
Team
Het werk van een datawetenschapper kan in globale lijnen opgedeeld worden in beschrijvende statistiek; het vinden van relaties tussen meerdere variabelen en het creëren van (zelflerende) algoritmes. Wat over het algemeen niet bij de werkzaamheden van een datawetenschapper hoort, zijn data-engineering, data-architectuur, projectmanagement en it-implementatieonderdelen. Desalniettemin zijn deze disciplines wel op bijna elke data-vraagstuk van toepassing en dat is de reden waarom een datawetenschapper niet in zijn eentje kan opereren, maar zich thuis voelt in een team.
Daarnaast is er ook een wezenlijk verschil tussen een datawetenschapper en een bi-specialist. Een bi-specialist is over het algemeen gefocust op het generen van management-informatie en het visualiseren van data om dit vervolgens te rapporteren aan het management. De conclusies zijn gebaseerd op het verleden en niet op de toekomst, waar een datawetenschapper gebruik van maakt.
Gouden standaard
Er is geen gouden standaard voor het profiel van een datawetenschapper. Een datawetenschapper is in de eerste plaats een wetenschapper, zoals de naam al zegt. Daarnaast moet hij of zij kennis hebben van programmeertalen, statistisch vaardig zijn en het kunnen ontwikkelen van voorspellende modellen en algoritmes. Hoe dit profiel precies moet worden ingevuld, is per organisatievraagstuk verschillend. Er zijn veel programmeertalen en er is veel keuze uit technieken en tools die zijn in te zetten. Verwacht dus ook niet dat iedere datawetenschapper ervaring heeft met dezelfde technieken en tools. Aan de andere kant kunnen veel tools en technieken gemakkelijk worden aangeleerd, mits de basiskennis aanwezig is.
Waar ik zelf tegen aanliep toen ik op zoek was naar een baan als datawetenschapper, was hetgeen dat ik niet voldeed aan het volledig gezochte profiel. Ik werd een aantal keer afgewezen omdat hun gezochte plaatje – met de waslijst aan kwaliteiten – niet matchte met mijn ervaring en vaardigheden. Nu, twee jaar later, word ik regelmatig – soms wel wekelijks – benaderd door recruiters en headhunters die mij maar al te graag willen wegkapen. Zij vinden mij via LinkedIn, en hopen dat ik wil werken door heel Nederland tegen maar al te fijne arbeidsvoorwaarden. Ik sta hier licht sceptisch tegenover; weten zij wel waar de desbetreffende organisatie naar op zoek is en weten zij wat te verwachten van mij?
Digitalisatie of innovatie
Naast het hebben van de juiste kwaliteiten, moet een organisatie ook voorbereid zijn op het plaatsen van een datawetenschapper. Het CBS stelt dat slechts een klein deel van het midden- en kleinbedrijf (mkb) klaar zijn voor het toepassen van big data in hun bedrijfsprocessen [4]. Als een mkb hier nog niet voor klaar is, dan betekent dat vaak dat er eerst nog een digitalisatie-omslag plaats moet vinden, of dat er weinig ruimte is voor innovatie. Wanneer dit laatste het geval is, kan er getoetst worden bij een extern bedrijf of er waarde zit in de beschikbare data. Dit scheelt enorm veel in investeringen voor het aannemen van een geheel team, waardoor er uiteindelijk een hoop geld is te besparen.
Wanneer een organisatie op zoek is naar een datawetenschapper, vergeet dan niet dat deze niet alleen kan opereren, de vraag groot is en het aanbod klein is en dat je goed moet weten naar wie je opzoek bent en waarom. Het datawetenschapschaap met de vijf poten vinden, is zoeken naar een speld in een hooiberg.
[1] Davenport, T.H. & Patil, D.J. (2012) Data Scientist: The Sexiest Job of the 21st century. Harvard Business Review, 70-76.
[2] Yap, A.Y. & Drye, S.L. (2018). The Challenges of Teaching Business: Analytics: Finding Real Big Data for Business Students. Information Systems Education Journal (ISEDJ), 16(2), 41-50.
[3] Paysa Team (2017). Top colleges in tech.
[4] CBS (2016). Is het mkb klaar voor big data?
Meh! Het is heel herkenbaar, niet alleen voor het vak van de datawetenschapper die kennis moet hebben van die tig programmeertalen. Dat kan je voor heel IT land wel zeggen. Hoe vaak ik wel niet vacatures ben tegengekomen met een krankzinnige lijst van systemen, talen, tools die je moet kennen. Dat kan helemaal niet en is totaal onrealistisch. Dan wordt het moeilijk om mensen te vinden, het is niet even afvinken van de afkortingen. Je kan ook denken, boerenverstand, wat ervaring en wat je niet weet google je erbij.
Vroeger had je gegevensanalisten, die vanuit analyse van menselijke processen en data in staat waren deze te optimaliseren en in ICT processen om te vormen. Dit lijkt mij ook zo’n type job: vanuit een berg ongestructureerde data (een data lake) proberen nog iets van waarde te persen. Een beetje middleware developer zou zoiets moeten kunnen.
Als je als developer goed bent in het creeeren van (zelflerende) algoritmes, lijkt het mij voor de hand liggend dat je dat als freelancer doet, teneinde niet je IP te hoeven weg te tekenen aan een werkgever en zodoende een redelijke prijs kan onderhandelen ervoor.
En als je een bedrijf bent, dan lijkt het mij dat je eerst kijkt of jouw data lake wel intrinsieke waarde kan bevatten en daarna beter een “best of breed” applicatie/framework aanschaft waarin dit soort algoritmes gehuisvest zijn en continue door de leverancier worden verbeterd.