Na voorgaande sessies over bijvoorbeeld Agile en outsourcing was er donderdag 25 februari, vanuit Samenwerking Noord een inspirerend event over Big Data. Gehouden in een zeker ook inspirerend gebouw met perfecte voorzieningen: het CJIB (Centraal Justitieel Incassobureau van het Ministerie van Veiligheid en Justitie) te Leeuwarden.
Het Big Data Event werd afgetrapt met twee visieverhalen; één door Sogeti’s trendwatcher Erik van Ommeren en één door IBM Watson ambassadeur Nicky Hekster. Aan de hand van veel aansprekende en soms ronduit verbazende voorbeelden liet Van Ommeren zien welke revolutie er gaande is. Metingen verrichten, patronen herkennen, voorspellingen doen en de wereld gebruikmakend van data naar je hand zetten.
Zoals je mag verwachten van voornamelijk deelnemers van publieke organisaties, kwamen al snel issues aangaande privacy, ethiek en beveiliging om de hoek kijken. De gehele dag bleven die op gezette tijden (terecht!) de kop op steken, om veelal te leiden tot goede en scherpe discussies. Waarbij de economische impact en zaken rond afhankelijkheid en de risico’s die we daardoor lopen ook langs kwamen. Discussies die nu vooral nog de problematiek verkennen, maar die meer en meer zullen moeten leiden tot keuzes maken en oplossingen realiseren…
Vervolgens deed Hekster de ontstaansgeschiedenis van Watson uit de doeken, een cognitieve assistent die in staat is om taal en context te leren van experts uit allerhande domeinen gebruikmakend van gestructureerde maar vooral ongestructureerde data (voornamelijk teksten).
De bekendste voorbeelden komen uit de gezondheidszorg; met name Watson’s resultaten als oncoloog spreken tot de verbeelding. Maar Hekster presenteerde ook mooie voorbeelden over helpdesk ondersteuning, student begeleiding, financieel advies, recepten en ingrediënten zoeker en bovenal (pratend en spelend lerend) kinderspeelgoed.
Break-out sessies.
Zonder de andere presentatoren te kort te willen doen (want de meerderheid van de sessies heb ik dus niet kunnen bijwonen), denk ik dat ik vervolgens de leukste, maar zeker ook goed doortimmerde, presentatie van de middag heb bijgewoond. Die over big data-praktijkvoorbeelden door Jeroen de Graaf en Camiel van der Werf van het Landelijke Informatiecentrum Voertuigcriminaliteit (LIV, onderdeel van de RDW).
Deze jonge honden presenteerden zichzelf eerst aan de hand van hun LinkedIn-profielen. Xan der Werf bleek een raar gat in z’n cv te hebben (middels gevolgde interne opleiding verklaarbaar) en De Graaf presenteerde zichzelf met een netwerkanalyse van zijn connecties. Een visualisatietechniek die bij het LIV wordt toegepast om (criminele) verbanden te achterhalen.
Omdat zo’n beetje iedereen bij het LIV een BOA (buitengewoon opsporingsambtenaar) is kunnen ze ver gaan en beschikken ze over (goed gereguleerde en alleen met juiste doelbinding) toegang tot de gegevens van RDW, Politie, Belastingdienst en Verzekeringsbureau Voertuigcriminaliteit.
Beide heren vertelden over hun eerste, soms pijnlijke schreden op het gebied van machine learning en het terugkoppelen van analyseresultaten aan het veld. Uitkomsten van APK-steekproeven die voorspeld werden, gebruikmakend van een leerset waarin de te voorspellen uitkomst ook als (ietwat verborgen) invoervariabele werd gebruikt. Dan is het opeens slecht dat je ‘maar’ 97 procent juist voorspelt….Of een analyse die leek te wijzen op loverboys met dure auto’s, maar waar vooral voetballers en DJ’s als verdachten werden aangemerkt!
Uiteindelijk zijn op die verschillende gebieden, ook gebruikmakend van open en linked data, uitstekende en goed bruikbare resultaten bereikt, zoals verbeterde APK-steekproefplanning en signalering van katvangers.
De tweede middagsessie die ik bijwoonde was van het CJIB en werd gepresenteerd door Ietje Jacobs, terzijde gestaan door Tjeerd Zuidema.
In tegenstelling tot het LIV is de beweging die het CJIB maakt met data science meer gegrond in een traditionelere bi-benadering. Ook niet zo gek, als je bedenkt dat het CJIB een uitvoeringsorganisatie is en het LIV veel meer een informatie-verwerkend expertisecentrum. Een verschil dat Jacobs duidelijk, ook refererend aan de impact daarvan, voor het voetlicht bracht.
De eerste uitdaging waar zij en haar mensen voor stonden was te komen van ruwe gegevens tot informatie voor de strategie van morgen. Een kantelende werkwijze van zaakgericht naar persoonsgericht. Daar waar tot voor kort iedere zaak apart van kop naar staart werd afgewerkt, wordt steeds meer getracht om zaken rond personen te bundelen en daarmee effectiever en efficiënter te werken. Minder deurwaarders met meer resultaat op pad!
Jacobs en Zuidema gaven aan hoe zij met behulp van beslisbomen (gekozen omdat die beter uitlegbaar zijn) de doelgroep beter kunnen segmenteren (naar willen betalen & kunnen betalen), waarmee efficiency en meer opbrengst behaald wordt.
Levendige discussie
Deze zeer interessante dag werd plenair afgesloten met een levendige discussie van de zaal met de sprekers onder leiding van Gert-Jan van Dijk van Target.
Zaken als data is dé nieuwe grondstof en is van waarde c.q. is geld waard of wordt het nieuwe ruilmiddel, gerelateerd aan privacy en eigenaarschap van (jouw) gegevens. Ook de impact van de stormachtige (disruptive) ontwikkelingen op organisaties kwam aan bod. Moet je je anders organiseren, is Agile het antwoord op de gevraagde versnelling en wendbaarheid, hoe innovatie aan te jagen en welke competenties en vaardigheden vragen de toekomst!?
Nog veel vragen te beantwoorden! Maar op dit prima event kwamen de eerste voorzichtige antwoorden en aansprekende voorbeelden van toepassingen langs. Een best indrukwekkende stoet zelfs, die doet smaken naar meer! Ook maar weer eens het bewijs van hoeveel er op dit gebied gebeurt in het Noorden, ook middels Samenwerking Noord, dé it-netwerkorganisatie voor (semi-)publieke organisaties in Noord-Nederland.
“…welke revolutie er gaande is. Metingen verrichten, patronen herkennen, voorspellingen doen en de wereld gebruikmakend van data naar je hand zetten…”
Wat mij opviel:
1. De wereld zet je niet naar je hand. De wereld is de wereld en verandert voortdurend. Door “data”, “big” of “tiny”, kun je een beeld krijgen van de wereld zoals die was binnen de tijd en de context waarmee gezocht werd.
2. Het beeld is afhankelijk van welke metingen op welk moment worden verricht; het gevormde beeld is een subset van “de wereld”; datgene wat je niet meet behoort niet bij het gevormde beeld.
3. Wat je gaat meten is afhankelijk van wat je wilt weten. Ook daarin zit een beperking van de beeldvorming.
De revolutie kan dus ook zijn dat we het beeld van de wereld achteraf anders zien en interpreteren dan de werkelijkheid was.
Het is wellicht beter om preventief een proces in een zo vroeg mogelijk stadium te herkennen en preventieve actie te ondernemen zodat er geen “big data” ontstaat waaruit de fout kan worden gedestilleerd…
Het moeilijke van processen is het analoge karakter, weliswaar te volgen in heel kleine digitale stapjes (bv multi moment opnamen) maar toch (veel?) moeilijker dan een “big data” analyse. De bijvangst in de vorm van voor een zaak niet relevante private gevoelige informatie bemoeilijkt de zaak ook nog eens.
De volgende stap is pas de echte revolutie: “real time” alle niet gewenste processen in de “real world” in een zo vroeg mogelijk stadium detecteren en voorkomen dat ze afbreuk veroorzaken. Big data kàn daarbij helpen, maar er is meer voor nodig. En je zet er m.i. de wereld niet mee naar je hand…
@Dick, bedankt voor je doorwrochte reactie! Je trekt de discussie naar de filosofische (“kentheorie”) en sociologische (“wat willen mensen / wat wil de samenleving?”) kant; een arena waarin het debat over “Big Data” en alle positieve, maar ook negatievere, aspecten zeker ook thuis hoort. Ben benieuwd hoe anderen dit zien!