Een tsunami van Big Data overspoelt onze samenleving. Net als bij de kustbewaking is de vloedgolf het best op te vangen met een doordachte infrastructuur die de stroom geleid via een reeks van afvoerwegen naar daartoe ingerichte opvangreservoirs. Pas daarin wordt er informatie van gebrouwen. Wie alleen oog heeft voor de voorkant, de aanspoelende vloed van digitale gegevens, vergeet de opvang van de stroom en zal verdrinken in de data.
Wereldwijd maken naar schatting 1,2 miljard mensen op de een of andere manier gebruik van mobiele communicatie apparatuur. De eindeloze toepassingmogelijkheden zowel in de zakelijke als de privé sfeer dragen voor een belangrijk deel bij aan het vergroten van onze digitale data universum, waarvan IDC de omvang voor dit jaar vaststelt op 1,2 zettabytes (een zettabyte is een miljard terabyte). Een voor de gewone sterveling niet te bevatten omvang. Die heeft dan ook geen weet van al die social media toepassingen, rfid-chips, sensoren alsmede andere intelligente apparaten, die op de mobiele golf meedrijven en de datastroom in kracht en omvang verder laten toenemen. De kunst is om de (online) Big Data als informatie aan te wenden in de waardeketen van een onderneming. Pas dan is er sprake van datadividend.
Informatie is geïnterpreteerde data
Informatie wordt door informatiewetenschappers omschreven als geordende data. De systemen voor de bedrijfsprocessen genereren data. Die data combineren we met andere data van externe systemen en er ontstaat weer nieuwe data. Om data te gebruiken buiten de geautomatiseerde processen, bijvoorbeeld om aandeelhouders of financiële analisten te informeren over het reilen en zeilen van het bedrijf, moet je er informatie van maken. Je moet de data interpreteren. Maar dat moet je ook wanneer je aan de hand van data processen in een bedrijf wilt aansturen, zoals bij de logistiek, productie, verkoop, marketing en HR. Ook daar hebben de beslissers informatie nodig.
Beslissen op buikgevoel
Forrester signaleert dat kenniswerkers zich door een enorme hoeveelheid informatie moeten worstelen om de voor hen relevante informatie te bemachtigen. Het aanbod van data, geput uit zowel interne als externe bronnen is ontzagwekkend groot en groeit met de dag. Een studie uitgevoerd door Accenture laat zien dat ondernemingsbestuurders nog steeds beslissingen nemen op buikgevoel omdat ze te weinig vertrouwen hebben in de aangereikte stuurinformatie. Doch diezelfde studie toont ook aan, dat ondernemingen met een gedegen analytische infrastructuur, gevat in business intelligence (bi) systemen stukken succesvoller zijn dan hun louter op buikgevoel opererende branchegenoten.
Bi stelt een onderneming in staat om in het moderne zakendoen beslissingen goed te onderbouwen om te voldoen aan de interne besluitvormingsprocessen, maar ook aan de regels van verantwoord ondernemerschap. In feite is tijdige beschikbaarheid van informatie belangrijker dan de betrouwbaarheid. Een globaal weergegeven trend is voldoende voor een strategisch besluit. Aan een heel nauwkeurig vastgelegde trend heb je na drie weken niks meer: de beslissing is al lang genomen. Voor informatie ten behoeve van de strategische besluitvorming komt er nog een dimensie bij.
Op bestuurlijk niveau wordt vooral beslist op basis van externe gegevens. Dus is het van belang de externe bronnen te combineren met de interne gegevens, bijvoorbeeld door ze op één scherm te presenteren. Daarvan bestaan fraaie voorbeelden zoals omzetcijfers van mondiale vestigingen, weergegeven met geografisch informatie uit Google Maps.
Persoonlijke analysefunctie
Cisco voorspelt dat er in de wereld in 2015 ruim vijftien miljard apparaten in omloop zijn met een internetverbinding. Het gaat vooral om persoongebonden it-hulpmiddelen, in de vorm van smartphones, netbooks en tablets. Ook bi zal zich een weg naar deze in miljoenen oplage geproduceerde apparaten weten te banen. Mensen zullen bi 'on-device' onder meer gebruiken voor analyses binnen hun eigen netwerk. Trekken we deze persoonlijke analysefunctie door naar het bedrijfsniveau, dan staan we aan de vooravond van een geweldige ontwikkelingen op bi-gebied. De capaciteit van de mobiele apparaten staat vooralsnog niet toe om er permanent zware analytische applicaties op te installeren. Daarom is een slimme combinatie van mobiele apparaten, de cloud en in huis bi-oplossingen een belangrijke voorwaarde.
Minstens zo interessant is de ontwikkeling van de achterliggende it-landschappen. Want er is veel kracht nodig om die miljoenen apparaten binnen luttele seconden van informatie te voorzien. Van het internetgebruik hebben we inmiddels geleerd dat bij een response tijd van zes seconden mensen hun interesse verliezen en doorklikken naar een andere site. We zullen dus heel goed moeten nadenken over de structuur van onze bi-oplossingen. Wat willen we weten en binnen hoeveel klikken presenteren we het juiste resultaat?
Real time shoppen in datawarehouse
Voor een dergelijke real time bi-voorziening zijn andere databases en opslagtechnologie nodig. In de afgelopen jaren hebben systeemarchitecten op de vertrouwde fundamenten van transactie georiënteerde systemen datawarehouses gebouwd. Via een extractie en laadproces, eventueel voorzien van een data kwaliteitsslag, prepareert it elke nacht een datakubus die zich de volgende dag laat bevragen door daartoe bevoegde analytisch ingestelde medewerkers of via voorgeprogrammeerde dashboarden voor algemene bedrijfsmanagers. Dit proces bevat geen geheimen meer.
Met de komst van Big Data is de datastroom voor bi-doeleinden in onze 24-uurs economie te groot geworden. Met de bestaande it-hulpmiddelen zijn we niet meer in staat om in de nachtelijke uren datawarehouses te voeden. De toegenomen omvang van het datawarehouse en de snelheid waarmee stuurgegevens op vele soorten 'handheld'-apparaten beschikbaar moeten zijn, vraagt om een bi-architectuur waarbij in één proces razendsnel een reeks van databronnen wordt geraadpleegd. Daarvoor ontbrak tot dusver de benodigde processorcapaciteit. Bovendien was vroeger geheugen duur en maakten we dus selectief gebruik van de opslagcapaciteit. Die beperkingen zijn er niet meer. Bi-architecten zijn niet meer gebonden aan de gangbare techniek van data opslag via SQL-gebaseerde databases. In-memory databases bieden nu functioneel en prijstechnisch een ideale basis voor real time analyses, uitgevoerd op operationele gegevens. Een Big Data bi-oplossing rangschikt data volgens kolommen, leunt op een krachtige indexeringstechnologie en staat een Google-achtige zoekmethodiek toe.