Over welke karaktereigenschappen moet je beschikken om een succesvolle data-scientist te zijn? En vanuit welke discipline kun je een dataspecialist worden? Computable vroeg het zijn datamanagement-experts Mark Vetter, oprichter van Voys, en Remko Arts, managementconsultant bij QNH Consulting.
Alle data-scientists hebben een fascinatie voor data en de informatie die erin verborgen zit, vertelt Mark Vetter, oprichter van Voys. ‘Hij of zij moet een analytisch persoon zijn die beschikt over enige vorm van programmeerkennis. Bovendien is nieuwsgierigheid een goede eigenschap.’
Remko Arts, managementconsultant bij QNH Consulting, meent dat een data-scientist grofweg over drie eigenschappen moet beschikken: statistische aanleg, programmeerkennis en inlevingsvermogen. ‘Data-science is statistiek. Een data-scientist moet daarom bedreven zijn in statistiek en aanleg hebben voor wiskunde. Zonder statistische kennis staat alles op losse schroeven.’
Als tweede eigenschap moet hij of zij kunnen programmeren en gebruik maken van verschillende tools, talen, pakketten, algoritmen. ‘Voor het bij elkaar brengen van statistische berekeningen en procedurele handelingen met dat is programmeerkennis noodzakelijk.’
De laatste eigenschap voor de dataspecialist is volgens Arts inlevingsvermogen in het domein. ‘Zonder toepassing op een domein blijft data-science koude cijfers. Domeinkennis koppelt cijfers aan werkelijkheid en interpretatie. Overigens moet hij of zij ook communicatief vaardig zijn. Dit ter ondersteuning om resultaten van datavisualisatie over te brengen.’
Niet enkel IT’ers
Vetter vertelt dat het gros van de data-scientists oorspronkelijk uit de it-hoek komt, maar hij ziet dat er een verschuiving plaatsvindt. ‘Door de schaarste komen ook mensen met een economische of biologische achtergrond in deze hoek terecht. Dat resulteert in specialistische studies tot data-science. Ik verwacht dat in artificial intelligence en voornamelijk machine learning de grootste groepen zijn die zich gaan specialiseren in dit vakgebied.’
Arts: ‘Ik ken dataspecialisten met een achtergrond in natuurkunde, wiskunde, biologie met een passie voor data, maar ook statistici die de traditionele statistiek los durven laten en zich programmeervaardigheden aanleren. Zij rollen in data-science via business-intelligence. Er is dan wel behoorlijk werk aan de winkel op het gebied van noSQL, statistiek/algoritmen en wellicht ook programmeren. De beste ingang blijft mijns inziens een bèta met affiniteit met statistiek en scripting.’