De afgelopen jaren zijn er talloze grote innovaties op het gebied van big data en analyse geweest. Van alle buzzwords en hippe productlabels, vind ik er persoonlijk maar één echt belangrijk: hybrid. Die term verwijst naar de belangrijkste les die we hebben geleerd tijdens de hele big data- en analytics-hype. Namelijk dat het voor bedrijven absoluut noodzakelijk is om hybride it-omgevingen te ondersteunen om de meeste waarde uit hun data te halen.
In het populaire boek, Crucial Conversations, wordt gesproken over ‘de sucker’s choice’, ofwel: een keuze voor sukkels. Dit verwijst naar een situatie waarin we moeten kiezen tussen twee slechte opties. Om hier het beste mee om te gaan, moet je de keuzes dieper bestuderen om te ontdekken hoe je van beide opties kunt profiteren. Dit is precies de strijd die ik bij veel organisaties zie als zij hun it-architectuur en data-strategie moeten bepalen. Ze hebben het idee dat ze moeten kiezen tussen Hadoop of een datawarehouse of een omgeving in de cloud of on premise. In beide gevallen is het goed mogelijk dat een combinatie misschien wel het beste zou werken. Het feit dat organisaties zichzelf dwingen een keuze te maken, weerhoudt ze ervan om een stabiel, toekomstbestendig en economisch levensvatbaar fundament voor hun data te bouwen.
Keuzes, keuzes, keuzes
Als ik het woord ‘hybride’ hoor opduiken in gesprekken over data-analyse, dan is het meestal een discussie over de problemen bij het kiezen van ‘het juiste platform’. Maar er zijn nog meer lastige keuzes, zoals uit de volgende voorbeelden blijkt.
• Platformkeuze: Data warehouse, Hadoop of een ander dataopslagplatform?
• Dataopslag: ssd of hdd?
• Data-integratie: strak, los of niet-geïntegreerd?
• Schemagebruik: schema-on-read of schema-on-write?
• Gegevensbescherming: encryptie, access control of masking?
• Tabelopslag: Latin of Unicode?
• Technologieleveranciers: Open source of proprietary?
Voor elk van deze keuzes geldt dat voor beide opties kiezen absoluut een legitieme mogelijkheid is. Dit is zeker het geval als je te maken hebt met grote enterprise-datafundamenten. Dan kan ik garanderen tussen beide opties kiezen onverstandig is. Laat het daarbij duidelijk zijn dat ik geen van beide opties als een slechte keuze zie. Alleen het maken van een exclusieve keuze, dat is slecht. Een goed hybride datafundament moet gebaseerd zijn op meerdere technologieën en meerdere methodes gebruiken om data effectief te kunnen opslaan, organiseren en analyseren.
Bedrijfsdoelstellingen
Een goed datafundament is dus gebaseerd op een hybride architectuur. Maar de vraag blijft: hoe besluit je welke combinatie van technologieën en methoden het beste werkt voor jouw organisatie? Het antwoord op deze vraag moet verkregen worden door te kijken naar de zakelijke doelstellingen. De business zal je nooit vertellen waarvoor het datawarehouse of Hadoop gebruikt moet worden. Toch zijn alle inspanningen die we in ons datafundament steken uiteindelijk bedoeld om zakelijke oplossingen mogelijk te maken. Vaker wel dan niet, zie ik dat er een ontbrekende schakel is tussen de bedrijfsdoelstellingen en de technologische keuzes. Alles begint met het definiëren van duidelijke zakelijke doelen voor data en analyse, die vervolgens vertaald moeten worden naar een architectuur die dit ondersteunt, wat op zijn beurt leidt tot enabling technology.
Natuurlijk zijn er ook een aantal praktische en legacy-factoren die van invloed zijn op de keuzes. Denk bijvoorbeeld bij het evalueren van de cloud heel goed na over data gravity. Waar bevindt de kern van je data zich, in de cloud of on premise? En wat betekent on premise precies? In je eigen kelder of in de kelder van iemand anders? Als de business de flexibiliteit van de cloud nodig heeft, dan is dat hetgeen waar je naar moet streven. Als echter al je gegevens op dit moment niet in de cloud staan, moet je wellicht een overgangsperiode overwegen om in stappen naar de cloud te migreren.
Vermijd de ‘sucker’s choice’
Deze snel veranderende tijden vragen om moeilijke architecturale en methodologische keuzes voor het beheren van data. Gewoon een enkel platform kiezen voor alle data en alle gebruiksscenario’s lijkt misschien een logische keuze, maar het is niet de meest efficiënte. Daarom zou je eerst even diep adem moeten halen, en kijken naar wat je nu echt wilt bereiken met de organisatie. Dan zal blijken dat het vinden van een slimme manier om technologieën en methoden te combineren in een hybride omgeving de beste manier is om je zakelijke doelen te bereiken.
Het is on-premises… echt waar! Dus met die extra s…
En hybrid is overigens in mijn ogen de sucker’s choice. Hybrid staat voor compromissen, halve keuzes, grotere complexiteit. Dat hybrid in sommige gevallen de enige keuze maakt betekent niet dat het geen sucker’s choice is!
Leuk stuk verder hoor 🙂
Wikipedia over on premise: “the incorrect usage is now commonplace among technology companies and technology news sources.” Henri die los gaat op zijn stokpaardje, de cloud. Gaat het artikel niet over maar het Internet van Data is ook niet zo zijn ding, als het maar via webservices beschikbaar komt. Zou Ewout winterslaap houden ? Misschien keertje data gravity in z’n oor schreeuwen.
Hybrid, je ziet het overal in automatisering.
SSD cache in een rotating Harddisk.
IT-ers die taal van business taal zouden moeten spreken.
Specialisten met brede algemene kennis.
Schapen met hybride poten, om efficient maximale wolligheid te enablen.
“Een enkel platform kiezen” “lijkt misschien een logische keuze maar het niet de meest efficiente” lezen we. Het moet hybrid. Anderen zien die oplossing weer als halve keuzes met grotere complexiteit. De suckers choice of het enige dat telt ?
Het ligt ook aan producten. Bewaar je nu wijn in je kelder of de menselijke resten. Toch weer die business case.
Big Data is een gegeven. Geen hype. Analytics komt er logischerwijs uit voort en is tevens geen hype, maar een middel om informatie te halen uit data, teneinde relevante inzichten te verkrijgen waarmee de concurrentie voorgebleven kan worden.
Aangaande Hybrid: Dit is geen doel. De auteur erkent dit impliciet:
“Maar de vraag blijft: hoe besluit je welke combinatie van technologieën en methoden het beste werkt voor jouw organisatie? Het antwoord op deze vraag moet verkregen worden door te kijken naar de zakelijke doelstellingen.”
Deze uitspraak geldt analoog voor wat de auteur schaart onder Hybrid. ‘Hybrid’ is een van de mogelijke middelen om zakelijke doelstelling te verwezenlijken, maar het is allerminst gezegd dat een hybride oplossing het best aansluit. Hybride is dus een middel, gelijk verschillende technologieën, methodes en frameworks op zichzelf een middel zijn om zakelijke doelstellingen te verwezenlijken.
Concluderend: There is no silver bullet. En als Big Data en Analytics in uw organisatie slechts buzzwords zijn, dan is Hybrid wel het laatste probleem waar energie aan besteed zou moeten worden.
@Dino: “Schapen met hybride poten, om efficient maximale wolligheid te enablen.”
Hahaha! Dat vind ik een mooie vondst! Maar ik ben het wel met Henri eens, dat we het juist moeten blijven benoemen. Je moet het niet fout gaan uitspreken omdat de rest dat ook doet.