In mijn werk is data en de analyse ervan dagelijkse kost en daarom volg ik andere experts die op Computable over dit onderwerp schrijven dan ook met extra interesse. Het is duidelijk dat het in 2012 niet meer simpelweg om data ging, maar om big data. Om het nieuwe jaar goed te beginnen heb ik de opinies over big data van 2012 bekeken om te kijken welke conclusies we daaruit kunnen trekken voor 2013, voor business én it.
Begin 2012 constateren de meeste big data-experts dat het voor organisaties niet voldoende is om een bi-oplossing te implementeren, de medewerkers te trainen en te verwachten dat iedereen vrolijk met (big) data aan de slag gaat. Ain’t gonna happen. Onderzoek van Gartner bleek in deze context relevant: Gartner ontdekte dat minder dan 30 procent van de potentiële gebruikers werkt met de binnen de organisatie aanwezige bi-tools. Aangezien big data een nog beperktere doelgroep kent, zal de adoptie nog lager zijn. Volgens de marktanalist ligt dat vooral aan de complexiteit van de meeste applicaties, de trage verwerkingssnelheid of het leveren van beperkt bruikbare informatie. Bi-technologieën in de vorm van mobiele apps die in dát gat springen zouden daar significante verbetering in kunnen brengen, aldus Gartner.
Expert Minne van der Sluis, BI consultant bij Imtech ICT, plaatst daarbij wel de kanttekening dat big data oplossingen dienen bij te dragen aan het bereiken van de doelen van een organisatie. Elke organisatie moet met de eigen business case aan de slag en niet met big data starten omdat andere organisaties dat ook doen. In mijn blog gaf ik aan dat de sleutel tot data-gedreven bedrijfsvoering toch vooral data-gedreven mensen zijn. Wanneer mensen op eenzelfde vanzelfsprekende manier met data-analyses omgaan als dat ze een koffiezetapparaat bedienen, dan zorgt dit voor een versnelde adoptie van bi.
Big data heeft niet zomaar waarde
Halverwege 2012 leidt deze kennis over de adoptie van BI tot het volgende inzicht: big data an sich heeft niet direct waarde. Edwin Peters, manager BU Solutions bij SAS, omschrijft het als volgt: “Data komt pas echt tot leven als je er trends in kunt herkennen, verbanden kunt leggen en voorspellingen kunt doen.” Hij pleit er dan ook voor de waarde uit big data te halen. Toch leidt het artikel van Ewout Dekkinga, IT Architect bij Unisys, ook tot de vraag of big data wel echt bestaat.
Overall is wat mij betreft de conclusie dat wanneer medewerkers allemaal de tools hebben om big data te analyseren, dat nog niet automatisch betekent dat er gouden bergen liggen te wachten. Het gaat erom wat je met de data doet; relevantie is het sleutelwoord, daar zijn we het over eens. Het succes van bedrijfsdata zit ‘m in de kunst ervoor te zorgen dat relevante data bij iedere laag en in ieder hoekje van de organisatie terecht komt. De data moet vervolgens eenvoudig omgezet kunnen worden naar bruikbare kennis, zodat gebruikers beslissingen kunnen nemen op basis van data.
De veranderende rol van IT
Gedurende het jaar zien we dat veel it-afdelingen de supersnelle ontwikkelingen op het gebied van big data met een gezonde dosis argwaan volgen. Verstandig, want je hoeft natuurlijk niet als een kip zonder kop achter alle trends aan te lopen. De valkuil is echter dat organisaties de boot missen wanneer ze zich te afwachtend opstellen.
‘Technologisch gezien staat niets organisaties nog in de weg om gebruik te maken van big data’, stelt Rob Dielemans, big data analytics expert bij Xebia. Maar ook hij vraagt zich af hoe het komt dat er toch nog veel bedrijven zijn die niet of nauwelijks gebruik maken van de kracht van big data. Een aantal experts ziet de rol van de it-afdeling verschuiven van de leveranciers van data naar de ondersteuners om de business zelf data te laten analyseren. In hun nieuwe rol moeten de it’ers data-analyse faciliteren met tools, kennis en security.
Expert Christiaan Vrieling, directeur van Vi Summa, schrijft in zijn blog dat het belangrijk is dat de it-afdeling stopt met het ‘eilandjes-denken’ en bewuster gaat samenwerken met andere afdelingen, zoals marketing en sales. Elke organisatie heeft natuurlijk één einddoel, en alle afdelingen werken uiteindelijk gezamenlijk naar datzelfde doel toe.
Hadoop en ‘the last mile’
Expert Edwin Peters bespreekt in zijn blog een aantal belangrijke gebruiksfuncties van Hadoop, zoals ‘staging area voor datawarehousing en analytics, (klant)gedraganalyse, marketingoptimalisatie en sentiment analyse’. De bestaande tools die werken met Hadoop zijn echter niet echt ontworpen om diepgaande analyses uit te voeren. De architectuur maakt de analytics erg langzaam.
Ik vergelijk big data-oplossingen vaak met de telecomindustrie: ook daar zijn ze bekend met het probleem van de ‘last mile’. In de telecom geldt dat, als het laatste stukje glasvezel niet wordt doorgetrokken naar de huiskamer, de gebruiker nog altijd geen verbinding heeft. Die uitdaging geldt ook voor big data: hoe goed de tools ook zijn, het is belangrijk dat de gebruikers op een eenvoudige en intuïtieve manier in de data kunnen zoeken naar verborgen ‘pareltjes’. Het zijn uiteindelijk de businessgebruikers met hun kijk op de business de juiste ontdekkingen kunnen doen die de investering in big data verantwoordt.
Er is in 2012 natuurlijk nog veel meer over big data geschreven, maar bovenstaande thema’s schetsen globaal waar we op dit moment staan. Voor 2013 denk ik dat de rol van it nog meer zal veranderen naar een faciliterende afdeling, die ervoor zorgt dat de zakelijke gebruikers zélf aan het werk kunnen met data. Daarnaast verwacht ik ook dat de mobiele trend door zal zetten. Je zult zien dat steeds meer technologieleveranciers hun producten éérst voor mobiele devices ontwikkelen en daarna pas voor de desktop.
Bovendien gaan gebruiksvriendelijkheid en visual analysis de boventoon voeren in 2013. Er zijn nu zo veel opties om uit te kiezen, dat wanneer een product er niet mooi uitziet of onhandig is in het gebruik, het een stille dood sterft. Technologieleveranciers moeten daarom hun verantwoordelijkheid nemen en ervoor zorgen dat data, hoe klein of big dan ook, eenvoudig en gecontroleerd beschikbaar is voor de zakelijke gebruiker.
Big Data Forum 2013
De tweede editie van het Big Data Forum vindt op 22 januari plaats in het Van der Valk-hotel Almere. Tijdens het Big Data Forum 2013 vertellen pioniers hoe een succesvolle big data-strategie wordt ontwikkeld en hoe het beste uit business data wordt gehaald. Bekijk het programma en meld je aan. Lezers van Computable bij vermelding van de kortingscode 67483comp 100 euro korting op de toegangsprijs.
Bas,
In mijn opinie stelde ik vooral de vraag of van Big Data niet een hype wordt gemaakt om zo een markt te krijgen voor de structured storage oplossingen die we al hadden in de tijd van het mainframe maar ook allemaal kennen van LDAP. En verder gaf ik aan dat gedistribueerde maar samenwerkende computergrids er ook al wat langer zijn. Net als jij nu doet keek ik dus achterom maar ook vooruit naar de mogelijkheden van Cloud Computing.
Dat de ‘last mile’ nog steeds in het netwerk zit is misschien wel omdat we blijven proberen om een golfbal door een tuinslang te blazen. Zolang het vergroten van de diameter van tuinslang te duur is zullen we dus wat anders moeten doen hoewel ik denk dat als diameter wel vergroot wordt we uiteindelijk proberen er een voetbal door te blazen. Iets met rupsje nooitgenoeg;-)
Dat storage leveranciers big data aangrijpen om bestaande en nieuwe oplossingen te verkopen is niet zo vreemd. Big data is hot. Het gaat echter niet primair om storage bij big data. De crux is om (voorspellende) analyses te kunnen maken op data die we eerst niet konden maken. Dat big data vaak ook veel data is, snel kan veranderen en in allerlei vormen buiten databases voorkomt maakt het complexer. Dat die data ook ergens opgeslagen moet worden (en weer toegankelijk moet zijn) staat er feitelijk los van maar is een randvoorwaarde om het te kunnen exploiteren. Daar moet dan een bepaalde oplossing voor gebruikt worden, qua opslag en processing.
Het ‘last mile’ probleem is dat we een dikke buis hebben met een laatste stukje tuinslang. Die tuinslang bepaalt wat er door kan. Dat is o.a. het geval bij legacynetwerken van koper- en coaxkabel met een fiber backbone. Een FttX netwerk kun je zo snel maken als je wilt, afhankelijk van wat je voor de actieve componenten wilt neerleggen en of het wel of geen lichtpad is.
De cruciale factor voor het waarde kunnen halen uit big data is de data scientist en niet de vele tools die we inmiddels hebben. Dat kan vast nog beter maar het gaat om kennis en ervaring en die ontbreekt nog grotendeels in Nederland. Dat is niets nieuws, de praktijk wijst uit dat de huidige BI tools ook door een groot deel van de gebruikers amper begrepen wordt. Analyses maken is dan ook geen ICT activiteit, het is werk voor de business. Big data als een ICT issue zien werkt niet. ICT moet zorgen dat het gereedschap en de grondstoffen er zijn. De business moet investeren in kennis opdoen en via praktijkoefeningen leren wat er uit te halen valt in nauwe samenwerking met ICT.
Dat ‘learning by doing’ is mede de reden waarom we vanuit Almere DataCapital nu een Big Data Value Center aan op het opzetten zijn waar vraag- en aanbod bij elkaar kunnen komen en er ruimte is om het gewoon te gaan doen zodat je ziet wat wel en niet werkt. En waar ook NL start-ups een kans krijgen te laten zien wat ze voor moois in huis hebben voor de BV Nederland.
Wie overigens de illusie heeft na een cursus steenhouwen met het beste gereedschap en de fijnste steen direct een Venus tevoorschijn te kunnen toveren zal bedrogen uitkomen, de natuurtalenten daargelaten. Het is hard werken om het te leren. Tijd om de mouwen op te stropen.
Oscar,
Nog even terug in de historie: SQL was ooit bedoeld om business (eigenaren) de mogelijkheid te geven om zelf analyses te doen op hun data maar het bleek uiteindelijk te moeilijk.
Een andere die ik vaak hoor is dat het bij BI meestal gaat om welk antwoord er mogelijk is terwijl het bij Big Data juist gaat om de vraag. Dat komt denk ik wel een beetje overeen met je voorbeeld van beeldhouwen.
Want de kunstenaar ziet in het rotsblok al direct een Venus zitten en hoeft dus alleen nog maar overtollig delen weg te halen.
Ewout,
Dit klopt wel wat je stelt. SQL is voor velen waarschijnlijk te moeilijk omdat er functioneel vanuit de gebruiker gezien geen directe relatie is tussen wat de data voor hem of haar betekent en hoe deze relationeel in de database zit. Ken je het relationeel model niet (en dan ook nog in zijn fysieke vorm) dan kun je de queries niet maken. Ik werk sinds 1982 met SQL maar heb ook in de begintijd nooit iemand uit de business er iets mee zien doen. Een ER diagram was doorgaans de limiet voor een kleine groep. Als je moet uitleggen dat bepaalde data in de 3e of 4e normaalvorm staat en daarom dus in tabel X of Y ben je echt iedereen al lang kwijt. Daar helpt ook geen SQL-generator bij die we toen ook al maakten.
SQL doet eigenlijk niets anders dan gestructureerd iets opbergen of weer tevoorschijn halen. Het is laatjes open en dicht doen. BI heeft daar een sterke relatie mee omdat het daar ook gaat om eruit halen wat een ander er al in gestopt heeft. Waarbij de business vaak klaagt (bij ICT…) dat ze de verkeerde data in de cube stoppen of dat het te oud is.
Big data kan allerlei vormen hebben (gestructureerd of ongestructureerd, opgeslagen of streaming, valide en niet valide) dus je kunt in principe elke combinatie maken in een algoritme. De kunst is om te leren waar en wat te zoeken en er iets zinnigs uit te krijgen binnen een bepaalde tijd. Dat kan een verwacht antwoord zijn maar ook iets waar je vooraf nooit aan gedacht zou hebben of zelfs fuzzy is. En met ‘klassiek’ BI dus nooit in je cube gestopt zou zijn. De gouden toekomst is voor bedrijven die uiteindlijk in staat zijn vragen in natuurlijke taal te vertalen in slimme en complexe algoritmes. IBM weet dat al een hele tijd, het Watson project is dan ook geen toeval.
Oscar en Ewout, dank voor jullie uitgebreide reacties. Jullie stippen precies het punt aan waar ik naar toe wilde met mijn verhaal: veel BI-tools zijn inderdaad nauwelijks gebruiksvriendelijk en daardoor wordt beschikbare data niet goed benut. Het moet voor zakelijke gebruikers mogelijk zijn om op een eenvoudige manier analyses uit te voeren, zodat de data ook echt waarde krijgt. Of de data nu big is of niet, als de business goede analyses kan maken, ontdekken ze de venus in het rotsblok!