Big data is een ware hype op dit moment. Elke achttien maanden verdubbelt de hoeveelheid digitale data op onze wereldbol. Vooruitlopend op onze collectieve bevindingen opgedaan tijdens de barre tocht op de 'slope of enlightenment' kunnen al wel wat conclusies getrokken worden.
Eén daarvan is wat mij betreft: Big data is een belangrijke technologie die helpt bij het bereiken van een meer duurzame economie. En met duurzaamheid bedoel ik in deze context minder verspilling van schaarse resources.
Deze vorm van duurzaamheid kan met name bereikt worden door:
- Meervoudig gebruik van data
- Efficiënter gebruik van informatie
Beide kunnen door middel van big data ondersteund of zelfs bewerktstelligd worden.
- Meervoudig gebruik betekent dat dezelfde bron aan informatie door meerdere afnemers kan worden gebruikt. Denk aan Twitter feeds, geo data of informatie over het weer. Data as a Service. Duplicatie is hier niet meer aan de orde omdat deze informatie als het goed is niet meer lokaal wordt opgeslagen voor eigen gebruik, en de daardoor ontbrekende redundantie scheelt weer opslag.
- Efficiënter gebruik houdt onder andere in dat, omdat er meer fijnmazige informatie (bijna) realtime voorhanden is, er betere beslissingen kunnen worden genomen en er dus minder tijd en resources verspild worden. De juiste informatie is echt in de juiste context en op het juiste tijdstip beschikbaar. Hierdoor hoeven er minder aannames te worden gedaan.
De eerste is waarschijnlijk gemakkelijk door iedereen voor te stellen. Dit gaat met name over publiekelijk beschikbare data die massaal wordt hergebruikt in plaats van dat het alleen voor eigen gebruik geproduceerd wordt. De tweede wellicht wat minder, maar dit kan concreet gemaakt worden met het volgende voorbeeld:
In de food sector, en dan met name de verswaren, is logistiek een grote uitdaging. Het voedsel is kort houdbaar, moet in vele gevallen gekoeld worden en blijven en is onderhevig aan seizoensinvloeden. Big data wordt in deze sector door zowel de supermarktketens, producenten als logistieke dienstverleners gebruikt om respectievelijk zo efficiënt mogelijk te voorspellen, produceren en distribueren.
Het trendmatige koopgedrag van klanten en het weer zijn belangrijke informatie om zo goed mogelijk te kunnen voorspellen welke groenten en fruit in welke hoeveelheden per supermarkt besteld moet worden. Het is zelfs zo dat de producent in de praktijk de voorraden van de supermarkt beheert op basis van deze zo actueel mogelijke informatie. Grote hoeveelheden data van binnen en buiten de eigen bedrijfsmuren moeten zo snel mogelijk kunnen worden geanalyseerd om op die manier de optimale bevoorrading te kunnen berekenen.
De logistieke dienstverlener zal op zijn beurt gebaat zijn bij het zo optimaal mogelijk vullen van vrachtwagens en deze een zo efficiënt mogelijke route laten rijden. Verspilling van brandstof is iets waar men niet op zit te wachten in deze branche, maar de natuur en onze longen ook zeker niet. Hier komt ook nogal wat bij kijken, denk bijvoorbeeld aan het feit dat niet elk type vrachtwagen elke supermarkt kan bevoorraden, simpelweg omdat sommigen te groot zijn. Ook is het zo dat veel verswaren niet te lang buiten de koeling mogen blijven en het hele proces van (order)picken tot afleveren liefst in één vloeiende beweging zou moeten gebeuren zonder al te veel ‘snijverlies’.
Waar tot kort geleden nog vaak te veel en in te grote verpakkingen werd besteld omdat het logistieke en productieproces het anders niet aankon, ziet men nu dat er veel fijnmaziger wordt geproduceerd en gedistribueerd. Big data is in deze sector niet meer weg te denken en leidt concreet tot minder voedsel- en brandstofverspilling.
Lees ik dit artkel en de reakties dan denk ik dat Big Data een verstopping gaan geven waar geen laxeermiddel voor bestaat.
Duurzame data bestaan niet, Computers worden grofweg sinds 1955 gebruikt, wie gelooft dat die data uit 1955 nog bruikbaar zijn droomt. Opslagmedia gaan geen eeuwigheid mee en ook de afspeelapparaten niet. Wie kan bijv. nog een 8 inch floppy lezen of een discpack uit een PDP?
Ik hoop van harte dat men statistici inzet bij het analyseren van de hoeveelheden data die we produceren maar ik vrees dat we te weinig kompetente statistici hebben wat gestaafd wordt door de vele onzinnige konklusies die je nu al ziet ontstaan.
Overigens data heeft geen “DNA”, misschien en indexering in de database.
En nu allemaal weer de beentjes netjes op de vloer brengen.
Nog een laatste speldeprik: Google is prima in staat om (near) real-time “analyses” op big data (the biggest data, want het hele internet) uit te voeren, zonder dat daar enige noemenswaardige vorm van metadatering aan te pas komt. Aangezien de meeste mensen Google als engine gebruiken (let’s face it) kunnen die gezamenlijk tot de zelfde (Google) conclusies gebracht worden en dus zonder dat ze het weten efficienter samen werken en dus duurzamer resultaten opleveren. Beentjes genoeg op de vloer weer?
@Ewout
“Een statisticus waadde vol vertrouwen door een rivier die gemiddeld één meter diep was. Hij verdronk.”
Dan is dat een hele slechte statisticus, anders had hij ook naar de standaarddeviatie gekeken. 🙂
Bijna niemand weet dat Google eigenlijk als intern NSA project is begonnen en later als zelfstandig bedrijf verder is gegaan met ‘civiele’ doelen. Dit overigens volgens een NSA klokkenluider.
Zonder die backing van een zeer geavanceerd en rijke overheidsinstelling is maar de vraag of Google ooit zo groot heeft kunnen worden. Want nu Google een extreem groot marktaandeel heeft is deze connectie nog steeds relevant en waarschijnlijk ook actueel.
Johan Duinkerken : Is dit jouw grapje om te kijken of een roddel kan vliegen? Want ik neem aan dat het onzin is wat je schrijft en ik geloof er helemaal niets van en is tegengesteld aan alles wat ik gelezen heb.
Gijs, je voorbeeld overigens van Google gebruik ik ook regelmatig en blijft voor mij nog steeds mind-blowing.
Big Data is een interessant fenomeen. Veel staat nog in de kinderschoenen en soms is het lastig onderscheid te maken met reguliere data en big (ongestructureerde) data. Data kan voor ieder bedrijf interessant zijn, maar zoals het ge-hyped wordt geeft aan dat we nog niet op het plateau van productivity aangekomen.
Ik lees: BIG DATA is
– bijdragen aan beetje procesverbetering
– eigenlijk meta of smart data?
– een pechvogel, die verdronken is in een rivier
– tools en technische opslagmethodes
– tenslotte de ultime doodsklap voor vanalles: hype, de NSA en Google.
Zoals zo vaak het geval: Terwijl we gezellig onder elkaar een beetje aan het bakkelijen zijn over Big Data halen veel gebruikers (lees niet-ICTers) er gelukkig al heel veel profijt uit 😉