Van alle data wereldwijd is ongeveer 90 procent de afgelopen twee jaar geproduceerd. En dat is nog maar het begin: big data is dynamisch en de ontwikkelingen op dat gebied gaan snel. Op dit moment wordt gesteld dat 20 procent van deze data interessant is voor ondernemingen en de verwachting is dat dit groeit naar 37 procent in 2020. Een explosie van de hoeveelheid data en een stijging van de belangrijkheid van gegevens.
Big data is meer dan alleen een grote hoeveelheid data, maar toch ook weer niet. Het gaat vaak over data die zich buiten de organisatie begeven, maar wel relevant kunnen zijn. Dat zijn bijvoorbeeld gegevens afkomstig uit social media (LinkedIn, Facebook, Twitter, et cetera) en allerlei andere gegevens die op internet staan zoals het weer, statistieken, prijslijsten, rfid-logs en kassagegevens.
Door actiever om te gaan met deze gegevens, ontstaat er meer inzicht. Zo kan Business Intelligence een rol spelen in het behalen van een betere performance. Maar hoe zet je (big) data om naar bruikbare informatie die de business een boost geeft? Dit zijn drie do’s en don’ts als het gaat om werken met big data:
Do #1: Ga samen aan de slag met data
Het is essentieel om aan de slag te gaan met data, op veel meer plekken in de organisatie dan voorheen. Dus niet alleen vanuit een managementinformatiesysteem, maar geef meer mensen toegang tot de informatie. Inzicht krijgen in data betekent inzicht krijgen in processen, waardoor je die processen kunt optimaliseren en je data daarmee toegevoegde waarde krijgt.
De samenwerking tussen afdelingen zorgt daarbij voor een optimaal resultaat. Een organisatiestructuur met IT als producent van de informatie en gebruikers als consument wordt vaak als de beste structuur gezien voor dit proces.
Do #2: Regel een ‘handige’ expert in de business
Een extra sales-medewerker vertegenwoordigt extra inkomsten, maar een andere mogelijkheid om meer te verkopen is door beter inzicht, verkregen door een ‘handige’ expert. Door dat inzicht kan de organisatie zich richten op klanten die echt willen en kunnen groeien en op producten met een goede margebijdrage. De echte toegevoegde waarde van de handige expert zit in het maken van de link tussen de business en data – voor de eigen interne data, maar ook voor de overige data.
Ter illustratie: een gegevensanalyse van de kassadata zorgt bijvoorbeeld voor een betere planning van het winkelpersoneel. Wanneer het druk is in vestiging A kan het anders zijn dan in vestiging B. Combineer dit met bijvoorbeeld weersgegevens en men kan proactief flexkrachten gaan plannen. Big Data voegt een nieuwe dimensie toe aan een bestaande planningsmethodiek.
Do #3: Haal het optimale uit je bestaande data met moderne tools
Je kunt pas scherp sturen op bepaalde doelen en beslissingen nemen als je inzicht hebt in specifieke gegevens. Je kunt niet sturen op voorraad als je niet weet hoeveel voorraad je nog hebt, bijvoorbeeld. Dat inzicht schept helderheid op verschillende gebieden, waardoor organisaties kunnen zien welke producten goed verkopen, waar verbanden liggen tussen producten en of consumenten die producten al eerder hebben gekocht.
Die antwoorden komen voort uit bestaande data, die in iedere organisatie gewoon beschikbaar zijn, maar niet altijd toegankelijk. Alle beschikbare gegevens zijn dus een mooie bron van inzicht en verbetering, die benut kan worden met de juiste moderne tools.
Don’t #1: Het is geen kwestie van alles of niets
Organisaties die er zeker van zijn dat big data direct toegevoegde waarde bieden, moeten dit zeker gaan onderzoeken en ermee aan de slag gaan. Wanneer een organisatie twijfelt, is het beter om laagdrempelig kennis te maken met big data-toepassingen. Bijvoorbeeld het aanbieden van social media-analyses van je eigen merk, naam of label.
Er zijn websites die social media-kanalen analyseren om te zien wat de algemene stemming is ten aanzien van de ingevulde naam. Dat kan erg handig zijn om te bekijken hoe de markt een campagne beleeft, en die het eventueel snel bijsturen mogelijk maakt. Zo zou best kunnen blijken dat integratie van een dergelijke toepassing met het dagelijkse proces of andere gegevens gewenst is.
Don’t #2: Maak er geen it-project van
Dit hangt samen met do #2: Regel een handige expert in de business. Zelf met big data aan de gang gaan is complex, dus it is zeker nodig. Als gevolg van de steeds belangrijk wordende data en big data zullen bedrijfsprocessen steeds meer it nodig hebben. It is dan ook een strategische asset van een organisatie en beïnvloedt, net als big data, bedrijfsprocessen steeds meer.
Don’t #3: Denk niet dat het allemaal een hype is
Data en big data gaan organisaties en het leven beïnvloeden. Ze worden strategisch in de bedrijfsprocessen en businessmodellen die er zijn (en nog uitgevonden moeten worden). Tien jaar geleden nam nog niemand een smartphone mee bij het hardlopen. Tegenwoordig is het de normaalste zaak van de wereld om met een smartphone te gaan hardlopen en met een app gegevens te verzamelen om te kunnen analyseren en dit te delen met vrienden in het sociale netwerk.
Social media en het ‘internet der dingen’ zorgen dat de ongekende datagroei alleen nog maar groter wordt. Op dit moment heeft 12 procent van de marketeers big data op de strategische agenda staan – een percentage dat naar verwachting enorm zal toenemen. Gelukkig worden de technologieën om laagdrempelig met big data om te gaan ook steeds beter. De groei zit in een enorme versnelling en het onderwerp wordt de komende tijd alleen maar belangrijker. Dit maakt nadenken over een strategie noodzakelijk.
Ik sta versteld van zoveel arrogantie. Hoe haal je het in je hoofd om data te gebruiken voor een doel waarvoor het niet bedoeld is. En toe maar, in Do #1 geven we gelijk “… meer mensen toegang tot de informatie.”. Waarom? Om te demonstreren dat als we misbruik maken van gegevens, dat we dat ook grootschalig doen?
Gelukkig geven de mensen waarvan gegevens geregistreerd zijn vaker blijk van verstand dan de marketeers die de gegevns analyseren. Deze maand las ik nog dat er een ongewoon groot aantal mensen hun verjaardag vierden op 1 januari 🙂 Hoe zou dat nou toch komen?
Als je dan toch big data wilt analyseren, doe het dan goed:
Do #1 – vraag de betrokkenen van je data set toestemming om de data te analyseren; als je dat te lastig vindt, informeer ze dan minimaal dat de data gaat analyseren; dat is wel zo fatsoenlijk;
Do #2 – minimaliseer je data set en verwijder alle bijzondere persoonsgegevens (zoals BSN, geloof, sexuele geaardheid, medische gegevens etc); data die je niet gebruikt, hoef je ook niet te anonimiseren
Do #3 – anonimiseer de data
En als dat allemaal gedaan is, dan dan pas analyseren. Houdt er daarbij rekening mee dat de data in hoge mate onjuist is (Scotland Yard hanteert de vuistregel dat 30% van hun criminal records minimaal één fout bevat, ondanks dat zij er veel aan doen om de data accuraat te houden).
Maar nog beter: don’t!
Toestemming is inderdaad fatsoenlijk. Focus op het vragen van de juiste, dus geen onnodige, gegevens is een prima aanvulling. Helemaal anoniem maken lijkt mij niet zinvol, het gaat er juist om dat je de taal spreekt van een bepaalde doelgroep of ijkpersoon en dan heb je nu eenmaal meer gegevens nodig. Het probleem van ‘de juiste data’ zal altijd een uitdaging blijven. Wel denk ik dat door de inzet van het internet de data beter wordt en verreikt kan worden. Bijvoorbeeld voorafgaand aan een campagne via internet aan contactpersonen een persoonlijke link sturen waarin zij, op hun eigen verzoek, gegevens achterlaten. Ik vermoed dat deze data beter is dan toevallig opgeschreven informatie die door bijvoorbeeld een accountmanager in een CRM is achtergelaten. Tenslotte: Experts in de business bepalen inderdaad het succes!
Nou, nou, Cor. De wereld verandert niet omdat jij het zo graag wil zien. Data heeft geen doel, data is gewoon data. Daarnaast gaat dit artikel daar helemaal niet over en kun je helemaal niet uit dit artikel halen of er aan de nederlandse wet gehouden wordt en eventueel de morele kompas. Ik vind je opmerking over arrogantie in deze zin misplaatst.
Niettemin vind ik dit ook geen sterk artikel. Ik krijg niet het idee dat Roel ooit in de buurt geweest is van “big data” en ik zal zeggen waarom ik dat denk. Er staat werkelijk niet één concreet voorbeeld in en alle suggesties zijn gewoon klassieke data en BI as usual.
“handige” experts kunnen wellicht wat ideeën hebben over het domein, of suggesties geven naar welke correlaties gezocht kunnen worden. Maar het analyseren van big data is gewoon algebra, wiskunde en tools zoals Hadoop, Mapreduce en algoritmes zoals deze toegepast worden in machine learning en neurale netwerken. Misschien en die misschien is vreselijk veel groter dan hier geschetst word, komt er iets zinvols uit waarmee je een voordeel kan behalen op je concurrent…. maar ik daag je uit om 1 niet op het internet uitgekauwd voorbeeld te noemen van pure winst door big data. Veel succes.
Big data is gewoon een don’t voor 99% van de bedrijven, een kansloze missie.
Ik ben heel erg voor data driven decisions, maar dat is gewoon klassieke BI. ETL / OLAP / Datawarehouse en dat soort zaken, maar dat heeft zeer weinig met big data te maken.
De grootste winst uit big data is Google search, daar is een hele planeet slimmer (en dommer, lees “the shallows”) van geworden en is echt een harde case van hoe men profiteert van big data.
Do #4: Weet welk business vraagstuk je met big data wilt oplossen.
De tools en platforms zijn beschikbaar, plenty mensen willen je wel helpen een big data platform te realiseren, maar zorg dat je weet welk business vraagstuk je hebt, en of je dit met (big) data kunt oplossen. Ga dan pas naar de tooling i.p.v. eerst een platform neerzetten en dan pas kijken of je een business vraagstuk hebt dat je hiermee kunt invullen.
@Henri
Als data geen doel heeft waarom bewaren we er dan zoveel van?
De tweede fout die je maakt is dat principes van Big Data geen waarde hebben voor 99% van de bedrijven, kijkend naar machine gegenereerde data en mogelijkheden daarvan om operationele prestaties te verbeteren zitten er naar mijn opinie wel degelijk voordelen in. Zeg maar een soort van telemetrie 2.0 waarbij hoeveelheid data, de snelheid waarmee data binnen komt en diversiteit ervan door een ontwikkeling zoals IoT dus voor de nodige uitdagingen zorgt.
Misschien niet een voorbeeld dat je aanspreekt maar aangaande analyse van machine gegenereerde (meta)data – 4.500.000 metrics per uur – binnen operationeel beheer kan ik je melden dat gebruik van Big Data principes toch aardige besparingen op kan leveren. Tenminste als we op basis van de ToC ervan uitgaan dat een investering in een non-bottleneck geen rendement geeft en daarmee dus gewoon een verspilling is. Oja, door aggregatie van gegevens is met de nodige slagen om de arm ook een prognose te geven aangaande komende investeringen om juist die bottlenecks te voorkomen.
Een gevaar van data driven decision making – de contradictio in terminis van je reactie – is wel dat cijfers een eigen leven gaan leiden, dat je een soort van rijks ICT-dashboard maakt waar alle lichten op groen staan terwijl iedereen weet dat projecten met bloedrode cijfers geschreven worden. En een ‘compelling event’ zoals ontmaskering kan hierbij dan een behoorlijke impact hebben als het vertrouwen in een systeem geschaad wordt, de integriteit van je input is dus bepalend want anders is het niet meer dan liegen met statistiek.
Inzet van Big Data zoals auteur voor ogen heeft vertoont niet alleen voyeuristische trekjes waardoor opmerking van Cor wel degelijk hout snijdt. Mattijs Koot toonde al eens aan dat combineren van quasi identifiers het anonimiseren van datasets steeds moeilijker maakt. Maar inzet lijkt zich vooral te richten op de minst geloofwaardige afdeling van een organisatie, prognoses van marketing zijn tenslotte toch vaak als het weerbericht van Piet Paulusma.
Een ontwikkeling die je aansluitende op eerste stuk van mijn reactie aangaande IoT wel steeds vaker ziet is dat de ‘call home’ optie van systemen steeds vaker sales attendeert op een opportunity doordat de metrics aangeven dat een uitbreiding of vervanging aanstaande is. Dat is makkelijk maar het addertje onder het gras hier is dat je dus ook weleens investeert in een non-bottleneck want het zal duidelijk zijn dat de leverancier je niet gaat wijzen op mogelijke besparingen door bijvoorbeeld wel uitgegeven maar niet gebruikte resources te reclaimen.
Las hier dat ICT kosten per medewerker bij ziekenhuizen stijgen, bijna exact een jaar geleden schreef ik naar aanleiding van een ‘big data’ analyse aangaande operationeel beheer dat de ICT kosten voor ziekenhuizen per patiënt nog veel sneller stijgen. Uitgaande van een mogelijke besparing van 40% op het IT budget per jaar is dat voor een gemiddeld ziekenhuis al gauw een besparing van één miljoen. Dat lijkt misschien niet veel maar ik heb het hier dus over het ‘low hanging fruit’ wat dus niet alleen makkelijk te plukken is maar waar vooral nog vaak overheen gekeken wordt.
Zoals je al opmerkte veranderd de wereld niet, maakbaarheid hiervan blijkt steeds vaker onder druk te staan door met name de genoemde sociale media zoals ‘compelling event’ als project X in Haren al liet zien. Om hele verhaal terug te brengen naar een ‘verbind de puntjes, kleur het plaatje en maak het verhaaltje af’ gaat het allemaal om interpretatie, voeg vooral een beetje gezond verstand toe aan je data driven decision making.
Drs Roel. Expert Business Intelligence en Datamanagement. Maar hij komt niet verder dan :
– lekker allemaal samen aan de slag
– we snappen eigenlijk niet waarmee maar het is geen hype, daarom maar een handige expert inhuren die er wellicht wel iets van weet
– gebruik moderne tools
Big data als het bommelding, met heer Bommel als business : “verzin toch een list, jonge vriend”
Ewout,
Misschien heb ik me niet goed uitgedrukt met data heeft geen doel. Cor schrijft “data te gebruiken voor een doel waarvoor het niet bedoeld is.”
Wat ik bedoelde te zeggen is dat data zelf geen doel heeft, data is willoos. Mensen hebben doelen. Net als die quote die mensen gebruikten om illegaal te downloaden omdat “data/information wants to be free”.
Cor is van mening dat data die ontstaan is uit processen met andere partijen dat je daar niet zomaar mee mag spelen. Sure, er zijn inderdaad do’s en don’t daarin en de wet loopt daarop wat achter dus een moreel kompas is wenselijk.
De overige opmerkingen zijn verders zienswijze waar ik deels wel, deels niet mee eens ben (minder dan 1% is enterprise, om een voorbeeld te noemen). We zien elkaar volgende week, dan hebben we het er nog wel over.
Data zelf is nutteloos als je er geen slimme dingen mee kan, mag en gaat doen om er informatie mee te maken.
Big Data zal hoe je het wendt of keert er gewoon komen. Of sterker nog is er al bij heel veel organisaties maar dan nog wel vaak onder een andere naampje.
Echter blijven privacy en ownership bij Big Data nog steed zeer gevoelige punten.En zal dit de komende jaren nog veel discussie opleveren. Het opstellen van duidelijke(re) spelregels ( wetgeving ) is hier daarom ook geen overbodige luxe.
“Data heeft geen doel, data is gewoon data.”
Als de betreffende data gegevens bevat die kunnen herleiden tot een individu, is het verzamelen van zulke data die geen maatschappelijk nuttig doel heeft, sowieso niet toegestaan. (‘Commercieel nut’ valt daar m.i. niet onder.)
Daarom roep ik: Do #1 inzake ‘big data’ is: gegevens alleen verzamelen als die intrinsiek al 100% anoniem zijn. Dus geen koppeling aan cookies, geen locatiegegevens, geen tijdsgegevens, etc. (Vraag is of er dan nog veel overblijft.) Als je middels statistiek toch niet-anonieme gegevens boven water kan halen, is ’t verzamelen van zulke gegevens gewoon niet toegestaan. In NL, dan. Alleen wordt dit momenteel hard ondergraven middels de weg naar TTIP en vergelijkbare afspraken waardoor bedrijven (en hun commerciële belangen) boven de regeringen gaan staan.
@Henri
Misschien interesse om een 10Tb database cluster te kopen met daarop random gegeneerde data? Ideaal voor big data analyse. Ontdek interessante patronen om zo meer omzet te genereren uit je business samengaande met een first-market approach.
Nogal lastig om aan Big Data te beginnen als je weet dat je mogelijke concurrentie van top 100 bedrijven stuk voor stuk real-time inzicht heeft op de grootste Big Data berg ter wereld.