Big data is hot! Maar big data is ook een nogal onduidelijke term en containerbegrip. In de lijn van Gartner (die de term ‘Extreme Information’ hanteert) zou ik big data willen typeren met termen als: veel, snel, veelvormig, complex, wisselend van vorm en betrouwbaarheid, alom in- en extern aanwezig… Veel gebruikte voorbeelden zijn: clickstreams, intelligente meters (*), beeld en geluid, demografische en markt- en consumentgegevens, et cetera.
Big data confronteert bi (business intelligence) met een aantal niet mis te verstane uitdagingen. Uitdagingen die het best zijn te counteren als ze redenerend vanuit organisatiedoelstellingen worden aangevlogen en ‘klein gehouden'. Aan de andere kant is big data nog een tamelijk onontgonnen terrein waar het stellen van de juiste vragen en het onderkennen van de prangende uitdagingen belangrijker is dan het nu al komen met panklare oplossingen…
Big data is zeker geen ‘big nonsense', maar aan de andere kant geldt dat big niet altijd ‘beautiful' is! Laat je geen problemen (en zeker geen oplossingen!) aanpraten die je niet hebt… Net als bij datawarehousing geldt dat big data oplossingen ‘means to an end' zijn. Ze dienen bij te dragen aan het bereiken van de doelen van een organisatie! Niet dat de buurman 't al doet moet doorslaggevend zijn, maar een goede business case.
Big data bi-uitdagingen
In de brede zin van het woord komen in het big data-tijdperk de volgende uitdagingen op bi af:
• Bi kan niet meer volstaan met het aanbieden van separate analyse- en rapportageomgevingen; deze dienen daadwerkelijk in de informatieinfrastructuur en daarmee de beslis- en stuurprocessen geïntegreerd te worden!
• Daar waar van oudsher bi-architecturen lopen van in-flow (gegevenskopieën van bronnen) via opslag (datawarehouse) naar out-flow (kubussen en data marts en analyse- en rapportage daarop), gaan we veel meer naar gedistribueerde omgevingen, waarbij het fysieke datawarehouse niet langer het kristallisatiepunt is, maar veeleer het metadatamodel (**) . Onderdeel van de bi-architectuur vormen daarnaast nieuwe (soms hernieuwde) sterren aan het firmament als in-memory databases en appliances, maar uiteraard ook (hybride) cloud oplossingen.
• Veel van die ongestructureerde gegevensverzamelingen vragen zo om hun eigen analytische functionaliteiten; dergelijke content analytics bevindt zich wel aan de periferie van bi-omgevingen, maar stelt haar wel voor de nodige inhoudelijke en managerial uitdagingen.
Functioneel gesproken dient bi eindelijk eens uit de schaduw van het verleden te stappen. Teveel bi-omgevingen hebben nog te weinig feeling met het heden, laat staan met de toekomst, ze kijken toch vooral in de achteruitkijkspiegel. Zaken als planning, budgettering en voorspelling moeten bi meer gronden in het heden en laten kijken naar de toekomst. (***). Hetgeen een randvoorwaarde is voor het komen tot echte actie.
Klein houden
Aan de ene kant moet dus vooral gekeken worden naar de toegevoegde waarde van big data-oplossingen vanuit de doelen van de organisatie. Aan de andere kant moeten dergelijke trajecten klein gehouden worden. Immers, het is onontgonnen terrein, waarbij het zaak is zo snel maar ook zo efficiënt mogelijk als organisatie ervaring op te doen van waar de waarde zit. Samen leidt dat in korte slagen tot zinvolle opleveringen. Slagen die of leiden tot een beter begrip van de vereisten dan wel tot daadwerkelijke productieve oplossingen. De Agile aanpak van trajecten past daar uitstekend bij; ook omdat het inzet op interactie, samenwerking en flexibiliteit.
Volgens mij staan we pas aan het begin van een prikkelend en opwindend tijdperk!
Bij het betreden daarvan is het raadzaam goed je doelen voor ogen te blijven houden en niet te verzanden in oeverloze analyse. Om zo snel mogelijk met overdachte en kleine stapjes te ervaren wat big data voor je kan betekenen. Succes!
Voetnoten:
(*) meters die consumentengedrag en -verbruik meten, productieprocessen monitoren, weggebruik lussen en navigatiesystemen, mobiel belgedrag, etc. etc. (in essentie zijn clickstreams hier dus ook een manifestatie van…).
(**) het model dat beschrijft welke informatie waar vandaan komt (wanneer, hoe vaak, met welke issues), wat de definities daarvan zijn en welke business rules daarop van toepassing zijn.
(***) dat levert ook meteen een uitdaging op die in het verlengde ligt; daar waar de traditionele BI omgeving veelal read-only zijn dienen (analytische) zaken ook teruggeschreven te kunnen worden.
Ik zou zeggen “Denk tijdig over je data management na!”
Ik denk dat het handig is als de organisaties zich afvragen wanneer hun data veranderd wordt in Big Data! En wat is de maatstaf? De hoeveelheid, de complexiteit, structuur of iets anders? Data management is een proces dat integraal in de fundamentele laag van de beheerprocessen opgenomen moet zijn. Vooraf nadenken (over groei, soort & bron, snelheid)en een visie creëren voorkomen veel problemen en kosten dan achteraf dit aanpakken. Wanneer je data management goed op orde heb, dan zullen verschillende processen direct of indirect hiervan profiteren.
Organisaties dienen eerst controle te krijgen over hun data en het daar
bij behorende management. Pas als dit duidelijk is kan er in mijn ogen naar Big Data oplossingen gekeken worden. Niet alle data is geschikt voor Big Data en alles dient in/op Big Data platformen te landen.
Tevens vind ik Big Data nog te groot en te Amerikaans voor de Nederlandse markt.