It-voorzieningen, gebruikt tot in de haarvaten van onze samenleving, genereren zoveel digitale gegevens, dat we inmiddels spreken over big data. Het lijkt een angstaanjagend fenomeen. Heel geruststellend is de ongelimiteerde hoeveelheid beschikbare processorcapaciteit . Die was pakweg tien jaar geleden niet voorhanden. Nu zit de kunst in het kiezen van de juiste applicatie voor de juiste toepassing op het juiste moment. Wie z’n data-infrastructuur op orde heeft, pikt voor een relatief lage investering de krenten uit de pap. Wordt het optimaliseren, innoveren of allebei tegelijk?
Sterrenkundigen zijn gewend om dagelijks met astronomische grote getallen wetenschappelijk onderzoek te verrichten naar gebieden ver buiten ons helaal. Een simpele ziel op aarde wordt welhaast krankzinnig bij de gedachte zo nietig te zijn in dit onvoorstelbaar grote universum. Eenzelfde gevoel van machteloosheid overkomt je ook wanneer je de omvang van het fenomeen big data probeert te schetsen. Kende de wereld vijf jaar geleden naar schatting een opslagcapaciteit voor zowel analoge als digitale data voor in totaal driehonderd miljard gigabytes, na amper vier jaar maakten datawetenschappers al melding van 988 miljard terabytes . Na terabytes volgen de petabytes. En omdat we ook met die veelvoud de grens van het onvoorstelbare naderen, slaan we exabyte over en komen we terecht bij zettabytes, oftewel 10 tot de macht 21. Volgens de laatste schatting vorig jaar zou de data omvang 1,2 zettabytes hebben bedragen ( 1 zettabyte is 1 miljard terabyte). Het ziet er naar uit dat we binnen afzienbare tijd uitgroeien naar yottabytes, oftewel 10 tot de macht 24.
Focus op bruikbare informatie
In die abstracte getallenreeksen lijkt een nul meer of minder niet uit te maken. Net als de afstanden tot verre hemellichamen heeft ook een schatting van de totale data-omvang weinig betekenis in het dagelijkse leven. Wij ordenen data naar informatie. En daar kunnen we wat mee. In die zin is het wellicht belangrijk om je niet te veel te laten leiden door de omvang van big data, maar te focussen op de bruikbare informatie die daaruit valt te destilleren. Het eerste wat dan opvalt is dat big data niet persé een nieuwe fenomeen is, voortgekomen uit bijvoorbeeld de explosieve groei van mobiele communicatievoorzieningen. Al velen jaren generen organisaties data, waarvan de informatiewaarde niet juist werd ingeschat. Voor zover die data al is bewaard, is er in ieder geval niks mee gedaan. Bij het optimaliseren van de informatievoorziening, bijvoorbeeld bij het invoeren van systemen voor datamanagement, komt de data en de betekenis daarvan vanzelf bovendrijven.
Ondernemingen realiseren zich dan dat weliswaar data per bedrijfsonderdeel keurig is bijgehouden en opgeslagen, maar dat je aan die afzonderlijke silo's niks hebt omdat ze naar het hoogste niveau geen eenduidige stuurinformatie opleveren. Rationaliseren van het versnipperde IT-landschap naar een bedrijfsbrede opzet is heel goed mogelijk zonder de onderscheidende kenmerken van de diverse business units op te geven. Zo'n optimalisatieslag zorgt ervoor data datadefinities worden geharmoniseerd. Wat is van waarde waarvoor en wanneer? Bedrijven die aan 'data life cycle' management doen, hebben dan ook veel minder moeite om business intelligence applicaties snel en effectief door de gehele organisatie uit te rollen. En of je die slimme vragen nu op veel dan wel op extreem veel data afvuurt, is meer een kwestie van processorcapaciteit.
Waarde voor de business
De technologie om snel en doeltreffend de groeiende databrij te rubriceren en te analyseren is voorhanden (denk aan 'in-memory' databases en algoritmen voor het indexeren van zowel gestructureerde als ongestructureerde data). Zowel in- als externe databronnen laten zich combineren en verschaffen het management de mogelijkheid te zoeken naar trends. Dat proces is heel goed te structureren op voorwaarde dat mensen op alle niveaus in een organisatie zich bewust zijn van de waarde van de databronnen voor de totale onderneming. Wanneer het fundament voor business master data management eenmaal is gelegd, brengt het aanbrengen van een volgende verfijninglaag waarmee informatie is te leveren ten behoeve van bijvoorbeeld supply chain aansturing of het beheren van de kasstroom, minder inspanningen met zich mee. In vergelijking tot de investering in de uitrol van een bedrijfsbreed erp-systeem, is de toevoeging van een systeem voor operationele bi maar een heel klein stapje. Dat was ook de ervaring bij het Rotterdamse veevoederconcern Provimi. De waarde die daar voor de business is gecreëerd, blijkt significant. De investering betaalt zich snel terug door een direct en beter inzicht in de voorraden. Minder voorraden betekent minder beslag op het werkkapitaal .
Na een optimalisatieslag krijgen organisaties de ruimte om na te denken over het vernieuwen van bedrijfsprocessen, innoveren dus . Voor veel mensen is big data daar ook mee verbonden, zeker nu de samenleving in een steeds sneller tempo digitaliseert. Een voor de consument herkenbaar voorbeeld is de slimme elektriciteitsmeter die de energiebedrijven bij hun afnemers willen plaatsen. De door de meters geregistreerde data wordt op een centrale plaatst door de elektriciteitsleverancier uitgelezen en opgeslagen. Met de miljoenen aangesloten huishoudens praat je dan over echt big data, zeker als de meter ettelijke keren per jaar wordt uitgelezen. Aan de inzet van technologie voor in-memory computing valt niet te ontkomen. Daarmee zijn de meetgegevens sneller in te lezen en real time te analyseren dan met conventionele databasetoepassingen.
Vervuilde bestanden opschonen
Minder spectaculair dan het in gebruiknemen van real time analyse en simulatieprocessen, maar wel heel noodzakelijk, is het om de reeds aanwezige hoeveelheid data op te schonen. Door de reeks van fusies en afsplitsingen in de energiesector is de kwaliteit van de databestanden in het geding gekomen. Energienetwerkbedrijf Alliander koos ervoor op dat vlak eerst de organisatie op orde te brengen alvorens nieuwe IT-oplossingen in te voeren. Nadat de data-eigenaren waren geselecteerd konden datakwaliteitsteams worden gevormd. Het begrip kwaliteit laat zich volgens de energiedistributeurs samenvatten in vier woorden: volledigheid, actualiteit, juistheid en nauwkeurigheid.
Wie met klantvriendelijkheid zich staande wil houden in de sterk competitieve energiewereld, zal zijn big data moeten ontdoen van vervuiling. Dat levert direct ook een betere beeld op van de situatie achter de abstracte cijfers. Zo ontvingen 6000 klanten van het energienetwerkbedrijf een naheffing van een bedrag variërend tussen de vijfhonderd en veertienhonderd euro. Wat bleek? Ze hadden een aansluiting voor grootverbruikers, maar betaalden toch al jarenlang het gewone tarief. Een deel van hen had zo'n aansluiting helemaal niet nodig. De aansluiting is verkleind en de naheffing komt te vervallen.
Meer panklare apps voor analyse
Big data wordt vaak gekoppeld aan nieuwe vormen van klantinteractie. De manier waarop consumenten via social media heel direct hun oordeel over producten kenbaar maken, trekt een zware wissel op de analysecapaciteit van marketingorganisaties. Panklare in-memory oplossingen,direct beschikbaar als appliance of uit de cloud, ontrafelen na een korte inleertijd de stroom van data die de consumptieve voelsprieten van een marketing organisatie 24-uur van de dag opvangen. Databasemarketing liet zich nog nooit zo gericht en accuraat uitvoeren. De truc zit in het weten waar en wanneer je de voelsprieten moet plaatsen. In de industrie vormen sensoren al veel langer gemeen goed. In combinatie met in-memory technologie worden de barrières in reactietijd en effectiviteit doorbroken. Maatschappelijk van grote waarde is het door Fujitsu geïnitieerde concept voor het vernieuwen van de processen in de landbouw. Door gebruik te maken van de analysemodellen rond big data, zijn betere oogsten te realiseren.
De wereldbevolking neemt toe; er moeten meer monden worden gevoed. Gelijktijdig worden natuurlijke hulpbronnen schaarser en heeft de toegenomen CO2 uitstoot op den duur toch een negatieve uitwerking op de groei van gewassen. Sensoren op en rond de akkers houden nauwlettend alle ontwikkelingen in de bodem en de lucht in de gaten. Wat voor weer gaat het worden? Hoe is de gesteldheid van de bodem? Welk effect heeft bemesting gehad ? Het zijn allemaal vragen waarover de sensoren input aanleveren aan een analytische machine, die voorspellingen berekent en gecombineerd met de kennis over vorige oogstjaren scenario's voor een verantwoorde agricultuur uitwerkt.
Ongeacht of het gaat om een maatschappelijk belang dan wel een bedrijfsbelang, de adequate opvang en verwerking van big data vertoont snel rendement op het geïnvesteerde kapitaal. Gebaseerd op in-memory technologie levert SAP een kant en klare appliance voor onder andere Controlling and profitability analysis (Copa), smart metering (slimme energiemeters), trade promotion management (tpm) en strategic work force management (swfm). Overigens staat het iedereen vrij om met de bijgeleverde developers kit een applicatie te bouwen. Het is net als bij apps voor het mobility platform: de vloedgolf van optimalisatie en innovatiemogelijkheden zwelt aan zolang de mand met direct inzetbare applicaties gevuld blijft. Wie een technologische vinding voor langere tijd van maatschappelijk en economisch nut wil laten zijn, kiest voor ontwikkeling van direct toepasbare oplossingen en stimuleert eindgebruikers en partners in het ecosysteem om hetzelfde te doen.
Mark,
Goed stuk.
Big data kan aantrekkelijk zijn voor een organisatie die aan de juiste parameters voldoen. Het is van belang om vooraf goed te kijken of je organisatie bij Big Data past. Big Data is namelijk niet altijd een must maar kan een organisatie wel helpen om extra service en diensten te leveren.
Als je als organisatie geschikt bent voor Big Data is er op veel vlakken winst te behalen ( financieel / extra service / diensten ) Maak vooraf de juiste afwegingen voor dat je je in de Big Data hype stort.
In dit stuk worden een aantal rake opmerking gemaakt over bruikbaarheid en waarde maar ook veel generalisaties gemaakt. Veel voorbeelden gaan over de gestructureerde data, welke misschien niet altijd ontsloten is maar wel aanwezig en binnen invloed van organisatie. Maar het idee fixe dat ‘big data’ de vervanger kan zijn van gevoel, het boerenverstand om bijvoorbeeld de agricultuur te verbeteren is nogal vergezocht. Kijkend naar de efficiëntie van onze akkerbouwers is er al veel gemechaniseerd en geautomatiseerd maar worden deze inspanningen niet snel terugverdiend. Zo hadden supermarktketens, die al heel lang bezig zijn met klantenkaarten en data analyse de verkeerde conclusies getrokken waardoor de koelhuizen vol zitten en boeren nu complete oogsten tegen verlies moeten laten vergisten. En ondertussen vraagt de burger zich af waarom de groente toch zo duur is in de winkel.
Want ondanks alle systemen, enorme hoeveelheden data en snelle verwerking zijn we dan ook nog steeds niet in staat om precies het weer te voorspellen. Analyse van data, hoe groot deze ook is kan helpen om een trend of anomalie te herkennen maar is nog steeds geen ‘kristallen bol’ waarmee we de toekomst kunnen voorspellen. Oja, en ik denk dat er maar weinig bedrijven zullen zijn die zetabytes of yottabytes aan gegevens gaan analyseren of ze moeten plannen hebben om Internet te backuppen. Het gaat volgens mij dus niet zo zeer om de omvang maar de toegang tot gegevens, zeg maar de democratisering van kennis.