Wanneer organisaties in 2015 resultaten willen bereiken met het gebruik van big data, zullen zij zich moeten focussen op het stroomlijnen van processen. Bovendien is big data-ondersteuning voor het Database Management Systeem in 2015 zeer gewenst. Dit zijn enkele van de voorspellingen die Computable-experts hebben gedaan op het gebied van business intelligence (bi) en big data.
Volgens Huub Hillege, principal data(base) management consultant bij Info-Shunt, doken in 2014 vooral jongelui, vers van Universiteit en Hogeschool, bovenop big data met als belangrijkste toepassing Hadoop en aanverwante software. ‘Oude wijn in nieuwe zakken: Het gaat hierbij vooral om het tellen van aantallen per situatie en dertig jaar geleden telden we ook in de databases.’ Maar op de vragen wat de business case van big data eigenlijk was, waarom hier resources aan worden besteed en wat big data analyse op zal leveren, konden zij volgens Hillege vervolgens geen antwoord geven. ‘Ook was er meestal niets geregeld op het gebied van backup en restore. Heb je een storing, dan heb je misschien gewoon pech voor een maand, omdat de data niet meer te herstellen valt.’ Hillege heeft big data in 2014 dan ook voornamelijk als grote hype ervaren, waarbij de dergelijke goede vragen opvallend genoeg vooral door de oudere generatie werden gesteld.
Minne van der Sluis, senior business consultant bi bij Imtech ICT Management & Consultancy/Bostec, vindt big data in 2014 juist niet langer meer een buzzword, maar is het werkelijkheid geworden. ‘Zowel voor business management als it-professionals. Menig organisatie zet stappen om haar vele en snel bewegende in- en externe gegevensstromen te temmen en te integreren. Bovendien willen ze deze ook nog inzetten om klant- en bedrijfsprocessen te voeden met nieuwe inzichten en stuurinformatie.’ Daarmee werden volgens Van der Sluis dan ook veelal verrassende resultaten geboekt. ‘Dergelijke organisaties onderkennen de enorme waarde van informatie en worden daarmee meer en meer data-gedreven.’ Van der Sluis benadrukt dat het hierbij wel gaat om de juiste data, op het juiste moment, in de juiste vorm en in het juiste kanaal.
Big data in 2015
Daadwerkelijk resultaten bereiken met het gebruik van big data gaat zich volgens Van der Sluis in verhevigde mate doorzetten in 2015. ‘Een mooi voorbeeld hiervan is IBM’s Watson Analytics; IBM’s cloud-based analyseplatform dat gebruik maakt van cognitieve technologie. Een platform waar veel, zo niet alle, innovatieve technologieën van de afgelopen decennia samen komen. Denk dan aan: kennistechnologie, natuurlijke taalverwerking, business intelligence, high performance computing, geavanceerde visualisaties, predictive en prescriptive analytics, et cetera.’ Dat is volgens hem een mooie uitdaging die IBM daarmee neerlegt bij andere aanbieders, gebruikers en adviseurs om in de komende jaren relevant te blijven en zich te blijven ontwikkelen richting die eerder gememoreerde data-gedreven organisatie.
Maar voordat deze resultaten echt bereikt kunnen worden, moeten organisaties het komende jaar wel tijd en geld gaan stoppen in het stroomlijnen van de processen, zegt Menno Heesbeen, regional managing director bij Redwood Software. ‘Immers,’ zo gaat Heesbeen verder, ‘het draaien van rapportages over data levert foutieve rapporten op wanneer de processen van data extractie, data import en rapport generatie niet op elkaar zijn afgestemd. In dat geval is de data namelijk niet up-to-date.’ Heesbeen legt uit dat het automatiseren van deze processen zorgt voor juiste rapportages en juiste regulatie van de belasting van de performance van systemen. ‘De huidige tools, zoals SAP BW, leveren onvoldoende management-mogelijkheden op. Enterprise process automation-platforms, zoals Redwood, zijn hiervoor een zeer bruikbare en vooral onmisbare aanvulling.’
Big data-ondersteuning Dbms
De meest gevaarlijke outsider van 2015 wordt EMC volgens Hillege. ‘Zij hebben door de overname van Greenplum (DWH appliance) een perfecte stap gedaan naar een ultiem software- en hardwareportfolio, waarin hun hardware storage oplossingen – en VMware in het productportfolio – belangrijke pijlers zijn.’ Hillege meent ook dat alleen de huidige Database management systeem (Dbms)-leverancies, die in 2015 big data-ondersteuning voor hun Dbms gaan geven, uiteindelijk de rit gaan winnen. ‘Zij zullen onder andere Hadoop gaan ondersteunen en appliances voor big data maken om die met hun bestaande DBMS te laten integreren. Teradata Aster en Teradata zelf zijn hier goede voorbeelden van en ook Oracle en IBM zijn deze weg ingeslagen.’
Het einde van Hadoop?
Hadoop is hierboven al een aantal keer genoemd als platform om big data te beheersen. De aanzet tot Hadoop is al ongeveer tien jaar geleden gegeven. ‘Best oud voor een techniek die, naast veel bewondering, ook veel kritiek oogst’, meent Arend Ruizendaal, directeur en consultant bij RondPunt. ‘De schaalbaarheid valt toch tegen, het is file-intensief, niet alle problemen zijn te parallelliseren, transactieondersteuning wordt gemist, Mapreduce-experts zijn niet te vinden.’ Google is gestart met de bouw van opvolgers, zoals Colossus, Spanner en Cloud Dataflow, aldus Ruizendaal. ‘Hiermee komt de transactieondersteuning terug, Nosql wordt opgevolgd door Newsql en mondiale schaalbaarheid wordt nagestreefd. Ook Apache oogst lof met de bloedsnelle in-memory oplossing Apache Spark. Zelden primair voor big data analyse ontworpen, maar wel zeer rap, en zeer goed schaalbaar.’ Ruizendaal zegt dat hij nu het Hadoop-platform omarmt en bedrijven die drijven op data lakes adviseert dat Hadoop hun oplossing is en het de investering waard is. ‘Maar voor hoe lang nog?’
Allemaal hardstikke prachtig natuurlijk. Sneller, mooier, bloedsnel. Helaas lees ik nergens dat Big Data voor minstens 40% of corrupt of niet kloppend is en hoe je dat nou uiteindelijk oplost.
Hier heb ik het natuurlijk over generieke en vrije big data. Niet de data die op exacte wijze tot stand komt.
Veel organisaties hebben moeite met eigen big data omdat ze wel heel afhankelijk zijn geworden van hun ERP softwareleverancier. Die hebben in het verleden mammoets naar binnen kunnen schuiven als zijnde de oplossing voor alles. Met de continue en steeds snellere veranderingen in en buiten de organisatie zijn de meeste ERP systemen gewoon niet geschikt om de informatie op de juiste plaats beschikbaar te krijgen. Onderhoud of eventuele aanpassingen zijn duur of niet mogelijk en dan wordt vaak voor halve oplossingen gekozen waarin de kwaliteit van data verminderd. Zie ook http://www.leanforms.com/uncategorized/big-data-de-onzin-voor-mkb-nederland
Vergelijken van big data over organisaties heen is helemaal een aparte sport. Heb zelfs al veel benchmarks gezien waarin bewust input data foutief werd opgevoerd om de concurrent niet wijzer te maken. Analyse van complete bigdata verzamelingen is dan geen absolute wetenschap maar behoeft ook een grondige onderbouwing met complexe statistiek. Vaak wordt dan ook op onderbuik gevoel beslist. De succesverhalen horen we dan terug, de vele missers niet.