Big data is een ware hype op dit moment. Elke achttien maanden verdubbelt de hoeveelheid digitale data op onze wereldbol. Vooruitlopend op onze collectieve bevindingen opgedaan tijdens de barre tocht op de 'slope of enlightenment' kunnen al wel wat conclusies getrokken worden.
Eén daarvan is wat mij betreft: Big data is een belangrijke technologie die helpt bij het bereiken van een meer duurzame economie. En met duurzaamheid bedoel ik in deze context minder verspilling van schaarse resources.
Deze vorm van duurzaamheid kan met name bereikt worden door:
- Meervoudig gebruik van data
- Efficiënter gebruik van informatie
Beide kunnen door middel van big data ondersteund of zelfs bewerktstelligd worden.
- Meervoudig gebruik betekent dat dezelfde bron aan informatie door meerdere afnemers kan worden gebruikt. Denk aan Twitter feeds, geo data of informatie over het weer. Data as a Service. Duplicatie is hier niet meer aan de orde omdat deze informatie als het goed is niet meer lokaal wordt opgeslagen voor eigen gebruik, en de daardoor ontbrekende redundantie scheelt weer opslag.
- Efficiënter gebruik houdt onder andere in dat, omdat er meer fijnmazige informatie (bijna) realtime voorhanden is, er betere beslissingen kunnen worden genomen en er dus minder tijd en resources verspild worden. De juiste informatie is echt in de juiste context en op het juiste tijdstip beschikbaar. Hierdoor hoeven er minder aannames te worden gedaan.
De eerste is waarschijnlijk gemakkelijk door iedereen voor te stellen. Dit gaat met name over publiekelijk beschikbare data die massaal wordt hergebruikt in plaats van dat het alleen voor eigen gebruik geproduceerd wordt. De tweede wellicht wat minder, maar dit kan concreet gemaakt worden met het volgende voorbeeld:
In de food sector, en dan met name de verswaren, is logistiek een grote uitdaging. Het voedsel is kort houdbaar, moet in vele gevallen gekoeld worden en blijven en is onderhevig aan seizoensinvloeden. Big data wordt in deze sector door zowel de supermarktketens, producenten als logistieke dienstverleners gebruikt om respectievelijk zo efficiënt mogelijk te voorspellen, produceren en distribueren.
Het trendmatige koopgedrag van klanten en het weer zijn belangrijke informatie om zo goed mogelijk te kunnen voorspellen welke groenten en fruit in welke hoeveelheden per supermarkt besteld moet worden. Het is zelfs zo dat de producent in de praktijk de voorraden van de supermarkt beheert op basis van deze zo actueel mogelijke informatie. Grote hoeveelheden data van binnen en buiten de eigen bedrijfsmuren moeten zo snel mogelijk kunnen worden geanalyseerd om op die manier de optimale bevoorrading te kunnen berekenen.
De logistieke dienstverlener zal op zijn beurt gebaat zijn bij het zo optimaal mogelijk vullen van vrachtwagens en deze een zo efficiënt mogelijke route laten rijden. Verspilling van brandstof is iets waar men niet op zit te wachten in deze branche, maar de natuur en onze longen ook zeker niet. Hier komt ook nogal wat bij kijken, denk bijvoorbeeld aan het feit dat niet elk type vrachtwagen elke supermarkt kan bevoorraden, simpelweg omdat sommigen te groot zijn. Ook is het zo dat veel verswaren niet te lang buiten de koeling mogen blijven en het hele proces van (order)picken tot afleveren liefst in één vloeiende beweging zou moeten gebeuren zonder al te veel ‘snijverlies’.
Waar tot kort geleden nog vaak te veel en in te grote verpakkingen werd besteld omdat het logistieke en productieproces het anders niet aankon, ziet men nu dat er veel fijnmaziger wordt geproduceerd en gedistribueerd. Big data is in deze sector niet meer weg te denken en leidt concreet tot minder voedsel- en brandstofverspilling.
Gijs,
Ik kan moeilijk de link leggen tussen BD en de zaken die je in je artikel benoemd hebt. De efficiëntie die je beschreven hebt heeft meer te maken met informatie management, informatievoorziening en optimaliseren van je processen. Uiteraard kun je hier en daar wat verbeteringen realiseren die te maken hebben met informatie en wetendheid uit BD maar dit kan een klein deel zijn.
Verder merk ik dat je de huidige stand (lees legacy)van de zaken verplaats naar een tijd in de toekomst. Dit vind ik niet terecht.
We gaan in de toekomst anders data genereren:
– Data krijgt een andere format waardoor bruikbaarheid en uitwisselbaarheid zeer eenvoudiger worden. Er zijn nu een aantal cloudleveranciers die bezig zijn met hun dienst gebaseerd op nieuwe dataformat. Als voorbeeld, de tekst die je met hun editor schrijft wordt in een database opgeslagen en niet in losse bestanden (.doc, ,pdf, .txt etc)Hierdoor zullen andere zaken rondom je data(tekst, foto, informatie etc) eenvoudiger aan BI gekoppeld kunnen worden. Dit is maar het begin!
– Er wordt een intelligente laag aan dataproductie toegevoegd die ons helpt om data classificatie eerder in het proces te realiseren. Hierdoor hebben we misschien een berg van data maar het is geordend en geschikt voor consumptie en BI,
– Niet alleen de productiekant van data maar ook BI wordt steeds slimmer.
Dus……maak je maar geen zorgen, het komt goed met Big Data 🙂
@Reza bedankt voor je feedback, maar… is het middel big data niet juist het mogelijk maken om steeds sneller, betere conclusies uit steeds grotere hoeveelheden data te trekken om daar mee het doel processen steeds meer te optimaliseren te bereiken?
Wanneer ik het woord ‘Duurzaam’ lees dan heb ik weer zoiets van … pffff
Duurzaam is, platgeslagen, iets wat lang mee gaat. Duurzaam is niet het finetunen van processen. Duurzaam is niet het op elkaar afstemmen van commerciële chains in verkoop of logistiek. Duurzaam is ook niet hoe op de best commerciële wijze een kip, koe, varken of paard groot te laten worden zodat dat geconsumeerd kan worden.
Digitale data en duurzaam
Het enige duurzame aan digitale data is dat we de middelen en mogelijkheden hebben data voor de komende eeuwen op te slaan. Niet meer, niet minder. Gaan we kijken naar die data?
45% corruptie regel
Minstens 45% van al die Big data is corrupt. Zoekt u maar fijn uit welk deel dat dan precies is. Hoe ik dat bedoel? Dat 45% van die data gebaseerd is op misrpresentatie, leugen, feitenverdraaiing, niets zeggend geneuzel, private en onbruikbara data.
Big data is vooral een commerciële excersitie waarbij je je als individu af moet vragen wat je daar nou mee moet. Kort en goed, vooral beseffen dat diegene die Duurzaam en Big Data kraaien iets van u nodig hebben. Uiteindelijk uw pinpas of bankrekening nummer. En daar is helemaal niets duurzaam aan.
Big Data is niet meer dan wat de term zegt. Het is een hoop data van verschillend pluimage waar je onverwachte en verwachte conlusies uit kunt trekken en betere voorspellingen kunt doen. Dat is echter geen ICT aangelegenheid maar een vakgebied van rekenaars (statistiek, econometristen e.d. professionals). De ICT kan zorgen voor de verzameling en beschikbaarheid van BD.
Laat eenieder dan ook vooral op zijn/haar juiste stoel blijven zitten, en vanuit het eigen vakgebied waarde leveren. Anders zal het uiteindelijk voordeel flink tegenvallen.
Gijs,
Je stuk gelezend hebbend krijg ik de indruk dat het niet zo zeer om Big Data maar de metadata gaat, meer het werk van de bibliothecarissen en archivarissen dan van statistici en econometristen zoals Godfried Bomans het al mooi stelde:
“Een statisticus waadde vol vertrouwen door een rivier die gemiddeld één meter diep was. Hij verdronk.”
Betere voorspellingen doe je niet met meer data, betere voorspellingen doe je met relevante en controleerbare data zoals we steeds vaker zien. Om te beseffen dat er teveel en in te grote verpakking besteld wordt heeft echt niet veel data nodig maar gewoon een goed werkend kanban (push) of polca (pull) systeem. RFID of andere machine gegeneerde data kan hierbij ondersteunend zijn maar dus alleen als het proces op orde is.
Betreffende logistieke proces krijg ik nog weleens de indruk dat ERP gewoon een mislukking is, bedacht door econometristen die zich op 10.000 mijl van een distributiecentrum bevinden.
Gijs,
Het is al duidelijk dat je middels meer informatie en nieuwe inzichten je bedrijfsprocessen, productontwikkeling, strategie etc etc kunt verbeteren. Het kan zijn dat je deze informatie uit Big Data haalt. Maar dit is mijn punt niet!
Ik probeer aan te geven dat:
A) we zijn nog niet in staat om Big Data te analyseren.
Zoals Einstein zei: Je kunt het probleem niet oplossen met dezelfde middelen die het probleem hebben gecreëerd”. Voor het oplossen van BD heb je verschillende expertises en tools nodig die nog in de ontwikkelingsfase zijn.
B)Big Data bestaat over een tijdje niet meer!
Onze (ict)wereld/middelen zijn niet zo ingericht om slim data te produceren en op te slaan. We genereren data die verder gedumpt wordt en daarna gaan we de zooi analyseren. Dit gaat anders worden.
We zien veel ontwikkelingen op o.a. 3 gebieden:
1) apparaten die data genereren worden slimmer. Data krijgt bij productie een DNA-code waardoor de eigenschappen, relatie tot andere bronnen en overige informatie snel terug te vinden zijn,
2)apparaten die data opslaan worden ook slimmer. Data wordt door een intelligentielaag (en misschien gebaseerd op hun DNA) opgeslagen waardoor analyse en hergebruiken mogelijk zijn,
3) BI en analyse tools worden verder doorontwikkeld.
Met de komst van Internet of Things krijgen we meer data. Deze kunnen we niet met de huidige middelen en werkwijze analyseren.
Ik vraag me het volgende af:
Met data kun je aan meer informatie komen en met meer informatie en nieuwe inzichten kun je meer geld genereren.
Zullen de leveranciers van apparaten (bijvoorbeeld Samsung met haar apparaten)die data genereren (inclusief Internet of Things), de data structuur volgens hun regels laten genereren om een vendor lock-in te vormen? Of zal de data die door bijvoorbeeld Apple iPhone gegeneerd zijn bruikbaar worden gehouden voor Google of Microsoft ontwikkelingen?
Ik hoop dat ze vooraf voldoende aandacht en tijd besteden aan de standaardisatie van verschillende aspecten. Anders hebben we weer te maken met veel touwtrek en eigen standaarden voor data-zaken.
Goede meta data bij de data in een internet of things wereld wordt cruciaal. Maar of de grote spelers tot één standaard zullen komen?
Mag ik bij deze dan de term ‘Smart Data’ reserveren voor de volgende hype? Dat is Big Data maar dan met de context er al bij opgeslagen en zichzelf indexeert zodat het gebruik hiervan vele malen makkelijker is.
@Johan ik zou patent aanvragen 😉
Johan,
Het gaat niet alleen om data zoals je dat in je reactie omschrijft. Alleen daarmee kun je het probleem van BD niet oplossen.
Niet alleen data + DNA (zoals uitgelegd in mijn reactie) maar ook de opbouw van data (lees mijn 1e reactie), de bruikbaarheid in de ketenanalyse, de juiste (BI)tooling en slimme opslag (en misschien nog meer) moeten bij elkaar komen om de problemen die BD gevormd hebben op te lossen. In dat geval hebben we geen big data meer maar wel Data As Usual 🙂