Big data: het is maar hoe je er naar kijkt! Een jaar geleden concentreerden artikelen en gesprekken rondom big data zich nog op de vraag of er sprake was van een hype of een realiteit. Inmiddels zien we de eerste voorzichtige voorbeelden van big data in de praktijk langskomen.
Daarbij is de definitie wel belangrijk, want in de meeste gevallen draaien de verhalen om het halen van interessante informatie uit enorme hoeveelheden gegevens, maar blijft een essentieel onderdeel van big data buiten beeld. Het onderscheidende van big data zit in het combineren van grote hoeveelheden interne én externe data om inzichten op te bouwen. Dus juist ook gegevens buiten de eigen bedrijfssystemen, zoals openbaar beschikbare informatie. Het is een gebied waarin er legio mogelijkheden zijn, allerlei toepassingsmogelijkheden aan de horizon gloren, maar er nog maar weinig in de praktijk wordt gebracht. Wat dat betreft sluit ik me aan bij een vergelijking die ik iemand hoorde maken over big data en seks bij pubers: iedereen heeft het erover, iedereen denkt dat de ander het doet, maar niemand heeft enig idee hoe het nou eigenlijk werkt.
We staan dus aan het begin van de grote experimenteer-fase. Zo stond recent het voorbeeld in de krant van een grote leasemaatschappij die gegevens van het eigen wagenpark had gecombineerd met schademeldingen gedurende winterse dagen en zo had kunnen concluderen dat bestuurders van auto’s met winterbanden minder voorzichtig rijden dan bestuurders van auto’s zonder winterbanden. Het is een mooi voorbeeld van inzichten die ontstaan door het combineren van gegevens uit verschillende bronnen. Of het met recht big data genoemd mag worden? Waarschijnlijk kunnen we dat pas over een paar jaar met zekerheid zeggen.
Al doende leren en profiteren
De meeste bedrijven zijn nu nog vooral nog bezig met interne processen en rapportages om te kunnen voldoen aan in de afgelopen jaren in hoog tempo geïntroduceerde internationale wet- en regelgeving. Waarom ze toch de eerste stappen in het territorium van big data moeten zetten? Het levert namelijk op drie fronten concurrentievoordeel op: op het gebied van omzet, veiligheid en de benodigde specialisatie van medewerkers.
Ten eerste blijkt uit wereldwijd onderzoek uit 2012 dat bedrijven die hebben geïnvesteerd in big data, daar ook echt van profiteren. 84 procent gaf aan dat big data hen helpt bij het nemen van betere zakelijke beslissingen. 80 procent van de ondervraagde Nederlandse bedrijven gaf aan gebruik te hebben gemaakt van data om inkomsten te genereren.
Ten tweede is ervaring opdoen een van de belangrijkste wapens tegen de grootste beren op de weg van big data, die in hetzelfde onderzoek naar voren kwamen: een overvloed aan data waardoor Nederlandse it-beslissers zich overweldigd voelen, problemen met security en een gebrek aan gespecialiseerde medewerkers voor het analyseren van data. De kennis om waardevolle conclusies te trekken op basis van de grote hoeveelheden beschikbare data is onmiskenbaar een vak. We zullen dan ook gaan zien dat ‘data scientist’ echt een functie gaat worden binnen organisaties, zowel intern als op consultancy basis. Bij deze functie is de business- kennis belangrijker dan de technische kennis en is er een noodzaak om als organisatie ‘in control’ te blijven. De logica achter de decision supportsystemen moet in beheer blijven van de organisatie zodat systemen niet met ons aan de haal gaan. Organisaties moeten bovendien niet volledig vertrouwen op externe partijen die de kennis hebben om data voor hen te interpreteren. Data is macht, en deze macht moet als asset geborgd blijven binnen de organisatie. Bedrijven die werknemers de kans bieden zich in eerste projecten tot deze ‘data scientists’ te ontwikkelen, nemen een voorsprong op de concurrentie.
En de wet van de remmende voorsprong dan? Er moeten inderdaad op het gebied van techniek nog de nodige stappen gezet worden, vooral wat betreft integratie met bestaande BI en analytics infrastructuur. Ook zal big data onder invloed van veranderingen in gebruik van devices (mobile) opnieuw veranderen. Mobile BI is niet alleen het gebruik van een kleiner scherm, maar levert op zich ook weer big data op die in analytics opgenomen moet worden. Zo zal het aantal toepassings-gebieden van bi alleen maar groeien, denk aan customer-analytics, gedragsvoorspelling en patroonherkenning. En juist daarom geloof ik dat er geen betere tijd is om te starten met big data dan nu, want de druk op de snelheid van beschikbaarheid van informatie zal alleen maar groter worden. Organisaties moeten sneller inspringen op ontwikkelingen en directe beschikbaarheid van stuurinformatie wordt onmisbaar.
Benchmark je eigen bedrijf
Voor bedrijven die na het lezen van mijn pleidooi nu meteen een duik in big data willen nemen, sluit ik af met een tip. Een van de meest voor de hand liggende big data projecten is het benchmarken van het eigen bedrijf ten opzichte van de branche. Brancheorganisaties verzamelen en publiceren gegevens over hoe de branche presteert. Combineer deze met je eigen data en kijk waar je als onderneming staat, bijvoorbeeld op het gebied van klanttevredenheid. Een volgende stap zou het toevoegen van Twitter-data kunnen zijn, maar bedenk van te voren goed wat je met die data zou willen doen. Want wat je ook gaat doen met big data: probeer altijd te werken aan een business case en laat je niet meeslepen in ‘big ideas’. Begin klein.
Tja, maar wat had de leasemaatschappij eraan? De conclusie is weliswaar goed geformuleerd, maar is geen conclusie. Zijn de meer roekeloze lease-rijders eerder geneigd winterbanden bij hun werkgever te bedingen? Word je statistisch van winterbanden overmoedig en ontstaat daardoor een strijdig belang tussen het individu en het collectief: hogere veiligheid voor wie niet overmoediger wordt, maar meer schade voor de leasemaatschappij als geheel? Of ook collectief minder schade maar minder minder schade dan je op grond van het veiligheidsaspect zou mogen verwachten? Roept u maar.
Overigens komt me dit soort observaties bekend uit de tijd van de opkomst van ABS.
Het faciliteren van inzicht in data ‘an sich’ is nog geen informatie, laat staan kennis. De kunst is het interpreteren en integreren van informatie: en met de toenemende hoeveelheid, complexiteit + tijdsdruk blijkt het steeds uitdagender om organisaties te sturen.
Ik ben het met Erwin eens dat specifieke business-kennis en het vermogen een juiste & snelle vertaalslag te kunnen maken naar beslissingen het uiteindelijke succes bepaalt.
Wanneer het gaat om bijv. klanttevredenheid geloof ik dat enkel data analyse niet heilig is, maar aanvulling met narrative research (zoals bijv. Sense Guide dit doet) een sterke toegevoegde waarde heeft.
Hoi Hellen, het probleem is nou juist dat je dit soort informatie niet kunt interpreteren. Je kunt er in je besluitvorming wel gebruik van maken, maar dat is heel wat anders. Je kunt kansen op verschillende uitkomsten berekenen met hun respectievelijke foutmarges. Maar om te interpreteren had de leasemaatschappij een aselecte groep wel en een referentie-groep niet van winterbanden moeten voorzien. Het zelfstandig wel of niet kiezen voor winterbanden, maakt verder iedere conclusie over oorzaak/gevolg-relaties of oorzakelijke verbanden (meerdere gevolgen met een zelfde oorzaak)volstrekt onmogelijk. Mensen die roekelozer zijn in het verkeer kunnen ook roekelozer zijn inzake de financiële consequenties van winterbanden, je moet afwegen in hoeverre mensen die veel kilometers maken een grotere kans lopen om als roekeloos te worden gekwalificeerd, je moet onderzoeken hoe in hoeverre welke mate van overmoedigheid daadwerkelijk er eventueel (gemiddeld) ontstaat uit de wetenschap van het rijden met winterbanden, in hoeverre die overmoedigheid zich uitwerkt tot daadwerkelijk meer ongelukken enz.
Voor het interpreteren en inzicht krijgen heb je echt aselecte groepen nodig. Gelukkig kun je big data heel goed gebruiken zonder te interpreteren. 🙂