Sinds 2010 voert Supply Value jaarlijks een onderzoek uit over de belangrijkste trends binnen het inkoopvakgebied. Sinds dit jaar voegen we daar het IT trends onderzoek aan toe. Het doel van dit onderzoek is het ondersteunen van Informatie management en technologie professionals bij het stellen van de belangrijkste prioriteiten en de juiste focus. In deze blog geven we een eerste doorkijk op de eerste trend van het onderzoek: Data Science.
Informatiesystemen, netwerken, databases, chips, computers, social media, websites, Big Data, Internet of Things: we werken tegenwoordig in een omgeving die steeds sneller digitaliseert. Data neemt hierin een belangrijke rol in, maar organisaties worstelen met de groei in de hoeveelheid en variëteit van data. Om deze data te kunnen en managen en er waardevolle inzichten uit te ontlenen is data science ontstaan. In 2012 bestempelde de Harvard Business Review de data scientist al tot The Sexiest Job of the 21st Century en in Nederland is een heuse Jheronimus Academy of Data Science opgetuigd. Deze opkomst van data science blijkt ook uit het IT trendsonderzoek uitgevoerd door Supply Value. Meer dan 50% van de respondenten rekent data science tot de drie belangrijkste trends. Bovendien geeft meer dan de helft van de respondenten aan komend jaar veel tot heel veel prioriteit te geven aan data science. Hiermee lijkt de toekomst van de data scientist rooskleurig te zijn.
Wat is data science?
Data science verenigt wetenschappelijke methoden, processen en systemen om zowel gestructureerde en ongestructureerde data te vertalen in kennis en inzichten. Vanuit de brede domeinen van wiskunde, statistiek, informatiekunde en computerwetenschappen maakt data science gebruik van technieken en theorieën. Met behulp hiervan doorloopt de data scientist verschillende fases om verschijnselen te analyseren en te begrijpen:
- Het begrijpen van de business en het probleem dat opgelost moet worden.
- Het verzamelen van data uit verschillende bronnen met behulp van data mining.
- Het opschonen en voorbereiden van de ruwe data voor verwerking.
- Het verkennen van de opgeschoonde data om patronen en bias te begrijpen.
- Het ontwikkelen van meetbare functies voor het probleem dat wordt geanalyseerd.
- Het modelleren van de data waarmee inzichten voor het probleem worden gegenereerd.
- Het visualiseren van de data op een simpele maar effectieve en visueel aangename wijze.
- Het begrijpen van de business om de cyclus weer compleet te maken.
Trendontwikkeling
Voordat data science is geworden tot wat het nu is, heeft het een aantal fases doorlopen. Het begon met een behoefte aan business intelligence, waarin de productie en consumptie van data bij elkaar kwamen. Aan het einde van de 20ste eeuw betrad de term Big Data het wereldtoneel. Met nieuwe krachtige tools werd het mogelijk om de bestaande interne data uit te breiden met externe data, zoals social media. Ook is het mogelijk geworden om met voorspellende analyses tendensen te herkennen en toekomstige trends te voorspellen.
Vervolgens zijn deze analytische methoden geïntegreerd in producten en diensten, waarmee data science is ontstaan. Praktisch iedere organisatie in iedere industrie kan gebruik maken van mogelijkheden van data science zoals betere zoekalgoritmen, aanbevelingen, suggesties en gerichte advertenties. De ontwikkeling van data science houdt hier nog niet bij op, maar gaat verder met automatisering van analysemethoden. Met artificial intelligence, machine learning en deep learning kunnen die methoden verder getraind worden om geautomatiseerd en zelfvoorzienend te worden. Omdat data gevarieerder wordt, zijn steeds complexere trainingsmethoden nodig voor deze automatische analyses.