Data en carrière, dát is nou een onderwerp waar ik echt iets mee heb, al dertig jaar. Evenals in de jaren ’80 van de vorige eeuw staan data weer in de belangstelling, na anderhalf decennium van desinteresse. We kijken vooruit door terug te kijken.
Stel dat u iemand ontmoet die een MBA ‘Client-Server’ op zak heeft. Of een MBA ‘Object Oriëntatie’. Vermoedelijk zult u dan een glimlach moeten onderdrukken. Welnu, de inschrijving staat open voor een MBA ‘Big Data’ aan de UvA.
Los van de big data-hype is er natuurlijk iets groots gaande rond data. We zitten in een tweede golf van datakoorts en net als in de eerste gaan slimme mensen dingen doen waarvoor ze vorstelijk zullen worden beloond. Het helpt daarbij om het verschil te begrijpen tussen data toen en data nu.
Mijn ict-carrière begon in 1986, ongeveer op de top van de eerste datagolf. Data waren de vijfde productiefactor. Leidraad was het evolutiemodel van Nolan dat beschreef hoe organisaties met losstaande applicatie-eilanden door een aantal crises heen moesten om te eindigen in een datawalhalla waarin alle gegevensverwerking plaats zou vinden rond één samenhangende bedrijfsgegevensbank. Met het begeleiden van organisaties naar dit data-Utopia zouden natuurlijk mooie carrières op te bouwen zijn, dat spreekt.
Het werd een drama. Natuurlijk een stil drama, zoals dat altijd gaat in de ict. Gegevens eenduidig definiëren was al te moeilijk. En databases structureren was (en is) meer kunst dan wetenschap en de meeste ict’ers waren (en zijn) op beide terreinen vergaand onbekwaam. In de jaren ’90 verschoof de aandacht mede daarom van data naar software: client-server, objectoriëntatie, turn key (haha) pakketsoftware.
Wie zijn carrière aan data had opgehangen had ondertussen geen probleem. Wat in het model van Nolan horror was – redundante en inconsistente data verspreid over veel beperkte toepassingen – werd, anders verpakt, juist het streven. Van systemen moest je afblijven. Wie nieuwe dingen wilde doen maakte een datawarehouse. En als dat moeilijk werd meerdere. Datawarehouses sprongen overal op en moesten worden ontworpen, gebouwd en – het allermoeilijkste – gevuld met data uit andere systemen. Het trieste eindpunt van deze ontwikkeling is de data mart, een database opgezet en gestructureerd voor één of enkele informatiebehoeften; eilandautomatisering nieuwe stijl.
Veel lezers van dit magazine zullen met mij op deze eerste datagolf hebben mee gesurft. Tussen pakweg 1995 en 2010 waren data passé terwijl de datachaos in de meeste organisaties explodeerde en er steeds meer handjes in plaats van hoofden nodig waren. Ik deed daaraan niet mee. Samen met gelijkgezinden bepleit ik sanering en een terugkeer naar het oorspronkelijke idee (maar dan hypevrij) van gegevensoriëntatie. Twintig jaar na oprichting van ons bedrijf Ockham mag ik vaststellen dat je tegen de stroom in zwemmend ook succesvol en welvarend kunt worden.
Wie een carrière in de data ambieert doet er goed aan om te bedenken dat het terugdringen of beheersen van de gegevenschaos sowieso aan heel veel mensen eindeloos werk gaat opleveren en dat dit werk niet eventjes wordt ge-offshored. Daar staat tegenover dat elke glamour ontbreekt, want anders dan in 1980 gelooft niemand meer dat het eindstation van een data-topexpert een plek in de raad van bestuur is.
Ondertussen is de tweede datarevolutie gaande. De brandstof daarvan is platform- en locatie-onafhankelijkheid (internet), capture van sensor- en gedragsdata (big data) en onbeperkte opslag en verwerkingscapaciteit. Die revolutie brengt niet alleen heel veel data maar ook nieuwe carrièremogelijkheden en fortuinen mee. Wie kans daarop wil maken doet er echter goed aan om ook te kijken naar de overblijfselen van de eerdere datarevolutie, want bij alle verschillen is er ook veel overlap.
Bij het bekijken van het curriculum van de MBA ‘Big Data’ sprong de aandacht voor datavisualisatie eruit, maar moest ik zoeken naar datastructurering. Dat zegt veel over wat ons de komende jaren te wachten staat. Big data zal zich de komende tien jaar ofzo vooral richten op big data marts: veel data voor weinig vragen. Dat is begrijpelijk: organisaties hebben nog nauwelijks idee van de mogelijkheden van het combineren van nieuwe sensor- en gedragsdata enerzijds en oude administratieve data anderzijds. Kosten-drivers ontbreken eveneens. Niet alleen kosten opslag en verwerking weinig, maar ook de verwerving van big data is relatief goedkoop. Hergebruik van administratieve data loont omdat het vastleggen zo kostbaar is. De miljarden kentekenregistraties boven onze snelwegen vergen niet veel meer dan een paar duizend camera’s. Een heel verschil.
Mijn verwachting is dat, als er later wordt geglimlacht om uw MBA ‘Big Data’, de gegevenschaos nog veel groter is dan nu. De druk om deze terug te dringen zal dan zo groot zijn dat iemand het Nolan-model zal afstoffen. Misschien wordt er dan ook weer onderzoek gedaan naar het opzetten van en migreren naar geïntegreerde gegevensbanken. Ik zal dat belangstellend volgen vanaf een idyllisch plekje in een exotisch land.
Dit artikel is eerder verschenen in Computable Magazine, jaargang 49, nummer 1, januari 2016.
Goed stuk René,
Non-normalisatie leidt tot eilandautomatisering nieuwe stijl, keer op keer.
Ik zie en lees allerlei artikelen over slimme (big) data, maar ik lees heel erg weinig over de broodnodige intelligente vragen die wij ons moeten stellen, bij al die geaggregeerde gegevens.
Bij onze vakbroeders en zusters uit de Quantum hoek leeft deze problematiek nog veel meer, zij realiseren zich terdege dat niet “data” de weg naar de oplossing is maar de juiste vraag…;) ze doen in elk geval moeite om voordat de techniek “mainstream” is, zich zorgen te maken over de vraagstelling (weten wat je wil weten). Misschien dat we al dit moois nog mee mogen maken, ik blijf hoopvol gestemd, ondanks de toestroom nieuwe ‘Big Data’ MBA goeroes… 😉
Al een lange tijd heb ik de slogan:
No Data No Business
Er is enige tijd geleden bijgekomen:
Make a business of your data
Dag René,
Heel bizar, ik heb vannacht over je gedroomd. Je had een oude renault 4 die ik stiekem van je geleend had, maar na wat wroeging ging ik naar je toe zodat ik je kon laten zien waar hij nu stond. Dromen komen vaak voort uit dingen die gebeuren overdag en jawel gisteren las ik over Ockham’s scheermes en vroeg me af of jouw bedrijfsnaam daaruit voortkwam (ja). Ik kwam op Ockham’s scheermes via een ander scheermes, namelijk die van Hanlon en die komt neer op “Never attribute to malice that which is adequately explained by stupidity” en daarop kwam ik weer omdat ik erachter kwam dat Microsoft nog steeds niet snapt hoe je een goede browser moet bouwen.
Deze bizarre inleiding om te komen tot een reactie op jouw opiniestuk. Data.
Wederom leest je stuk weg als een trein, met ook al wat herkenning uit mijn (data) verleden. Data is een thema in mijn leven en zo’n beetje iedere dag ben ik bezig met databases in vele vormen. Als ik als it-er mezelf ergens sterk in vind is het in data, databases en datastructuren, een onderwerp naar mijn hart dus.
Nu herken ik het falen in de IT branche, jij hebt er een vak van gemaakt. Als er een MBA van de faalindustrie bestaat ben jij cum laude geslaagd. Als je focus hebt op het falen zul je inderdaad zien dat er veel gefaalt word. Toch geloof ik dat falen niet het zwaartepunt is in de IT. Nooit in de geschiedenis van de mensheid was er zoveel gelijkheid in toegang tot kennis (is een product van data en inzicht) en was data zo goed te bewaren, verplaatsen en toegankelijk te maken. Je zou dus ook kunnen stellen dat er zeer veel goed gaat en veel bedrijven heel succesvol zijn door hun ding met data (zowel leverancier als klant). En natuurlijk is veel data wellicht saai, maar andere data weer heerlijk. Als je onderzoeker bent van een aandoening en toegang krijgt tot de diagnostisering van duizenden behandelde patienten, dan is data 1 groot feest.
Mijn standaard aanpak van data modelleren is zo trouw mogelijk blijven aan dingen voor wat ze zijn. Zo heb je wellicht studenten, docenten en ouders waarvan je verschillende dingen wilt vastleggen, maar sla je de overlap tussen die mensen ofwel het mens-zijn op in 1 tabel of entititeit. Zo heb je de assets van een bedrijf, maar sla je de specifieke gegevens over die auto op in een auto tabel en niet in asset-vrijveld1.
Tja en dat er naast structuur ook chaos bestaat, soit. Ik bekijk het zelf toch liever vanuit de positieve kant, want er gaat nog steeds veel meer goed, dan fout.
Het aanbrengen van een strategie tbv BigData is geen sinecure, en vereist ook dit keer visie en urgentie aan de kant van de ontvanger terwijl de tektonische verschuivingen die de propositie aanjagen op dit moment niet zichtbaar is. Dit is niet veel anders dan een loodgieter in 1998 uit proberen te leggen dat email en internet toegang essentieel zal zijn voor z’n handel.
Het antwoord toen was : ” jamaar, ik kan toch faxen ? ”
Het bedrijf is ondertussen vervangen door een leger aan werkspot ZZP-ers
“want anders dan in 1980 gelooft niemand meer dat het eindstation van een data-topexpert een plek in de raad van bestuur is.”
U bent slecht op de hoogte, veel grote bedrijven hebben een CDO tegenwoordig. Zeker in de VS is dit de gewoonste zaak van de wereld. In Nederland lopen we een aantal jaar achter.
Op de titel zijn nog wel wat varianten te bedenken, zoals:
Informatie! Daar kom je verder mee.
Kennis! Daar kom je verder mee.
Wijsheid! Daar kom je verder mee.
om maar aan te geven op welk uiteinde de auteur zich bevindt binnen het bekende DIKW-spectrum.
Daarmee lijkt zijn visie verwant met de doodlopende weg die Enterprise Architecten nu inslaan met een titel als: “Enterprise-architectuur en data-science – een slimme combinatie”.
Deze hele problematiek wordt overigens op schitterende wijze verwoord in de meest recente column van Jacob Spoelstra: “Minder info, betere beslissing”.
EA lost haar belofte van kostenbesparing pas in op het moment dat passieve consumenten veranderen in actieve “bedrijfsmedewerkers”, die de gewenste dienstverlening zelf realiseren of initiëren door middel van selfservice; een ontwikkeling die tegenwoordig ook wordt aangeduid met digitale transformatie. Met een aanhoudende focus op data (,processen en systemen) kun je een efficiënte en effectieve afhandeling van selfservice wel vergeten, onder andere door een drastische toename van complexiteit en een navenante afname van flexibiliteit.