Het is helder dat big data voor veel organisaties een uitdaging is. Vorige keer gaf ik al aan dat als je big data definieert als ‘any data volume or data complexity that puts you out of your comfort zone’, er momenteel veel ongemak zit, zowel bij de business als bij it. En beide zijn op elkaar aangewezen om het elkaar weer makkelijker te maken, of comfortabeler, zo u wilt.
De opkomst van big data heeft zichtbaar gemaakt dat de huidige invulling van de it-taak de afdeling tot een bottleneck maakt, in plaats van een enabler. Op het gebied van business analytics kreeg it steeds meer de rol van de maatwerkleverancier. U vraagt en wij draaien. Als de business bepaalde analyses nodig had zorgde it voor de kant en klare analyses, op basis van door specialistische analisten ontwikkelde modellen. Maar snel wijzigende omstandigheden en de noodzaak om steeds meer opties door te rekenen in steeds minder tijd, zorgden ervoor dat de business steeds vaker terug kwam bij it met aanvullende verzoeken. ‘What if…?’ Met de groeiende volumes, complexiteit en variabiliteit betekent dit dat it een bottleneck is geworden, met als resultaat frustratie voor zowel it als de business.
Met het toenemende aantal verzoeken om maar weer iets anders aan te leveren weet ik zeker dat menige it-afdeling vroeg of laat heeft geroepen: ‘Laat ze het lekker zelf doen.’ En inderdaad, dat is een interessante oplossing. Als de business zelf kan gaan ‘spelen’ met de data, kan gaan exploreren en uitproberen, zonder telkens naar it terug te hoeven, dan neemt de efficiency toe, krijgt de business sneller wat het zoekt (en wát het niet bewust zoekt, maar nu opeens wél vindt) en wordt it ontlast.
Om deze win-win situatie te bereiken moet er wel aan een aantal voorwaarden voldaan worden. Het bedrijf moet een cultuur van analytics ontwikkelen, waarbij de waarde van data wordt (h)erkend en het de zakelijke gebruiker duidelijk is met welke data gewerkt wordt, de herkomst, de kwaliteit, de betekenis, de mogelijkheden en beperkingen. Er moet een helder data governance beleid komen. Vervolgens moeten de analytics oplossingen zodanig gebruiksvriendelijk zijn dat je kunt spreken van approachable analytics. Analytics waarvoor je geen specialist hoeft te zijn om ermee te werken, met heldere visuele resultaten, die makkelijk met elkaar gedeeld kunnen worden. Software die gebruik maakt van de modernste technologie als het gaat om high performance computing en text analytics. En last but not least: de it-afdeling houdt de eindverantwoordelijkheid over de beschikbaarheid en de kwaliteit van de systemen, de hardware, de software én de data. It is daarmee weer terug bij zijn kerncompetenties, terug in zijn comfortzone. En de business? Die bedient zich zelf. Waar en wanneer hij maar wil.
Eens, en zo moet het ook zijn. Deze ontwikkeling brengt dan ook een verschuiving in kennis met zich mee, sommige zouden zeggen een nieuw vak: data-scientist. Want spelen met data is een ding, betrouwbaar inzicht ontlenen aan data vraagt net iets meer.
Dat zou ideaal zijn, maar de praktijk wijst toch wel uit dat de zakelijke gebruiker veelal weinig kennis en ervaring heeft op dit gebied. Een goed data governance model en gebruiksvriendelijke tooling is echt geen overbodige luxe, maar zolang de business nog altijd onvoldoende in staat is om hun behoefte goed in kaart te brengen en bijv. goede (business) KPI’s te definiëren, is er zonder rollen als Business Consultants en Business/Informatie Analisten vanuit IT (voor zover je die onder IT wil scharen) maar weinig zinvols te halen uit die verder heel waardevolle bak(ken) met data. En zo blijft het inderdaad bij spelen.
Het is ook een oplossing om regelmatig goed geschoolde it’ers een functie in de business te geven. Zij zorgen ervoor dat er op een goede manier met de data om wordt gegaan en weten hun voormalige collega’s bij it goed te vinden.
Grotendeels eens. Ik heb twee kanttekeningen:
1. ‘Analytics waarvoor je geen specialist hoeft te zijn’
Voor het juist toepassen van complexere statistische analyses heb je naar mijn mening juist statistici met business kennis nodig. De ‘data scientists’ waar Erwin ook aan refereert. Met de opkomst van big data is er een groeiende behoefte aan deze personen om zinvolle conclusies uit de beschikbare gegevens te trekken, Je hebt dus wel degelijk specialisten nodig, maar deze bevinden zich dan aan de business zijde.
2. ‘De it-afdeling houdt de eindverantwoordelijkheid over de beschikbaarheid en de kwaliteit van de systemen, de hardware, de software én de data.’
De it-afdeling kan niet (alleen) verantwoordelijk worden gehouden voor de kwaliteit van de data. De it-afdeling speelt heir slechts een faciliterende rol. De business is zelf eigenaar van en verantwoordelijk voor de datakwaliteit van haar eigen gegevens.
Erwin/Sjoerd: be aware dat de term ‘data scientist’ niet door iedereen hetzelfde wordt uitgelegd. Is het een Data Miner? Is er een PhD in statistiek voor nodig?
Ik gebruik zelf het liefst de beschrijving van een van onze klanten:
The term “Data Scientist” has varying definitions and is
the subject of some controversy. My definition includes:
* A person with advanced expertise and experience in at least
these three disciplines:
» Information Technology
» Business
» Advanced Analytics
* And who applies this multidisciplinary skillset to solve business
problems and to create new approaches as needed.
Sjoerd: IT faciliterend, dat is prima verwoord 🙂
Ralf: ik vind dat je organisaties heden ten dage te kort doet met ‘…maar zolang de business nog altijd onvoldoende in staat is om hun behoefte goed in kaart te brengen…’
Daarnaast gaat het volgens mij niet zozeer om KPI’s, maar hoe kan ik (complexe) business problemen (helpen) oplossen.