De do’s en don’ts op het gebied van big data

26 januari 2015 - 08:155 minuten leestijdOpinieData & AI

Van alle data wereldwijd is ongeveer 90 procent de afgelopen twee jaar geproduceerd. En dat is nog maar het begin: big data is dynamisch en de ontwikkelingen op dat gebied gaan snel. Op dit moment wordt gesteld dat 20 procent van deze data interessant is voor ondernemingen en de verwachting is dat dit groeit naar 37 procent in 2020. Een explosie van de hoeveelheid data en een stijging van de belangrijkheid van gegevens.

Big data is meer dan alleen een grote hoeveelheid data, maar toch ook weer niet. Het gaat vaak over data die zich buiten de organisatie begeven, maar wel relevant kunnen zijn. Dat zijn bijvoorbeeld gegevens afkomstig uit social media (LinkedIn, Facebook, Twitter, et cetera) en allerlei andere gegevens die op internet staan zoals het weer, statistieken, prijslijsten, rfid-logs en kassagegevens.

Door actiever om te gaan met deze gegevens, ontstaat er meer inzicht. Zo kan Business Intelligence een rol spelen in het behalen van een betere performance. Maar hoe zet je (big) data om naar bruikbare informatie die de business een boost geeft? Dit zijn drie do’s en don’ts als het gaat om werken met big data:

Do #1: Ga samen aan de slag met data
Het is essentieel om aan de slag te gaan met data, op veel meer plekken in de organisatie dan voorheen. Dus niet alleen vanuit een managementinformatiesysteem, maar geef meer mensen toegang tot de informatie. Inzicht krijgen in data betekent inzicht krijgen in processen, waardoor je die processen kunt optimaliseren en je data daarmee toegevoegde waarde krijgt.

De samenwerking tussen afdelingen zorgt daarbij voor een optimaal resultaat. Een organisatiestructuur met IT als producent van de informatie en gebruikers als consument wordt vaak als de beste structuur gezien voor dit proces.

Do #2: Regel een ‘handige’ expert in de business
Een extra sales-medewerker vertegenwoordigt extra inkomsten, maar een andere mogelijkheid om meer te verkopen is door beter inzicht, verkregen door een ‘handige’ expert. Door dat inzicht kan de organisatie zich richten op klanten die echt willen en kunnen groeien en op producten met een goede margebijdrage. De echte toegevoegde waarde van de handige expert zit in het maken van de link tussen de business en data – voor de eigen interne data, maar ook voor de overige data.

Ter illustratie: een gegevensanalyse van de kassadata zorgt bijvoorbeeld voor een betere planning van het winkelpersoneel. Wanneer het druk is in vestiging A kan het anders zijn dan in vestiging B. Combineer dit met bijvoorbeeld weersgegevens en men kan proactief flexkrachten gaan plannen. Big Data voegt een nieuwe dimensie toe aan een bestaande planningsmethodiek.

Do #3: Haal het optimale uit je bestaande data met moderne tools
Je kunt pas scherp sturen op bepaalde doelen en beslissingen nemen als je inzicht hebt in specifieke gegevens. Je kunt niet sturen op voorraad als je niet weet hoeveel voorraad je nog hebt, bijvoorbeeld. Dat inzicht schept helderheid op verschillende gebieden, waardoor organisaties kunnen zien welke producten goed verkopen, waar verbanden liggen tussen producten en of consumenten die producten al eerder hebben gekocht.

Die antwoorden komen voort uit bestaande data, die in iedere organisatie gewoon beschikbaar zijn, maar niet altijd toegankelijk. Alle beschikbare gegevens zijn dus een mooie bron van inzicht en verbetering, die benut kan worden met de juiste moderne tools.

Don’t #1: Het is geen kwestie van alles of niets
Organisaties die er zeker van zijn dat big data direct toegevoegde waarde bieden, moeten dit zeker gaan onderzoeken en ermee aan de slag gaan. Wanneer een organisatie twijfelt, is het beter om laagdrempelig kennis te maken met big data-toepassingen. Bijvoorbeeld het aanbieden van social media-analyses van je eigen merk, naam of label.

Er zijn websites die social media-kanalen analyseren om te zien wat de algemene stemming is ten aanzien van de ingevulde naam. Dat kan erg handig zijn om te bekijken hoe de markt een campagne beleeft, en die het eventueel snel bijsturen mogelijk maakt. Zo zou best kunnen blijken dat integratie van een dergelijke toepassing met het dagelijkse proces of andere gegevens gewenst is.

Don’t #2: Maak er geen it-project van
Dit hangt samen met do #2: Regel een handige expert in de business. Zelf met big data aan de gang gaan is complex, dus it is zeker nodig. Als gevolg van de steeds belangrijk wordende data en big data zullen bedrijfsprocessen steeds meer it nodig hebben. It is dan ook een strategische asset van een organisatie en beïnvloedt, net als big data, bedrijfsprocessen steeds meer.

Don’t #3: Denk niet dat het allemaal een hype is
Data en big data gaan organisaties en het leven beïnvloeden. Ze worden strategisch in de bedrijfsprocessen en businessmodellen die er zijn (en nog uitgevonden moeten worden). Tien jaar geleden nam nog niemand een smartphone mee bij het hardlopen. Tegenwoordig is het de normaalste zaak van de wereld om met een smartphone te gaan hardlopen en met een app gegevens te verzamelen om te kunnen analyseren en dit te delen met vrienden in het sociale netwerk.

Social media en het ‘internet der dingen’ zorgen dat de ongekende datagroei alleen nog maar groter wordt. Op dit moment heeft 12 procent van de marketeers big data op de strategische agenda staan – een percentage dat naar verwachting enorm zal toenemen. Gelukkig worden de technologieën om laagdrempelig met big data om te gaan ook steeds beter. De groei zit in een enorme versnelling en het onderwerp wordt de komende tijd alleen maar belangrijker. Dit maakt nadenken over een strategie noodzakelijk.

15 reacties op “De do’s en don’ts op het gebied van big data”

toet-toet schreef:

30 januari 2015 om 12:37

Iedereen gaat voorbij aan wat BigData nu eigenlijk is. Iedereen heeft het over de “DATA” omdat ook in de term BigData voorkomt. Echter de betekenis van BigData heeft wel wat met data te maken maar in BigData is “Data” het gevulde veldje in een Record van een Database waarin allerlei relationele verbindingen en complexe eigenschappen aanwezig zijn in het diabase model.

Volgens NIST:

Big data is where the data volume, acquisition velocity, or data representation limits the ability to perform effective analysis using traditional relational approaches or requires the use of significant horizontal scaling (more nodes) for efficient processing

Log in om te reageren
Ewoud D. schreef:

30 januari 2015 om 12:50

@Henri
Wat – naar mijn mening – Cor bedoelt is het fenomeen scope creep, data die verkregen is in het ene proces voor het andere proces gebruiken. Ben geen jurist maar het lijkt me dat WBP met regels derdenverstrekking dit min of meer verbiedt als daar geen uitdrukkelijke toestemming voor is. Probleem (beschreven rapport WRR iOverheid) is het ontbreken van ‘Chinese walls’ binnen organisaties waardoor data dus een eigen leven kan gaan leiden.

Dat heeft nog niet eens zoveel te maken met Big Data maar gewoon gemak waarmee middels ‘datamining’ een soort van bitcoins in gegevensverzamelingen gezocht kunnen worden. Ik ben het dan ook oneens met je opmerking over 1% Enterprise want deze strookt niet alleen weer eens met je eerdere beaming aangaande mogelijkheden van de cloud voor organisaties maar ook de definitie van ‘enterprise’ in de context van gegevensuitwisselingen. Je bent denk ik een beetje blijven hangen in het verleden als ik overweeg dat de Enterprise Service Bus al lang niet meer stopt bij de firewall van een organisatie doordat ondertussen de netwerken van verschillende organisaties met elkaar gekoppeld zijn.

En een ‘compelling event’ van een klokkenluider kan dan nog weleens een eerdere overeenkomst databewerking zoals Safe Harbor inhoudsloos maken. Vertrouwen is goed maar controle beter en het is om deze reden dat Unisys middels Stealth een mogelijkheid biedt om Communities of Interest te maken door de digitale informatiebeveiling veel fijnmaziger te maken. Als ik kijk naar reacties wordt de klok misschien niet gestolen maar ik krijg steeds meer twijfels over de tijd, data is namelijk het residu van een eerdere (be)handeling nu we papierstromen en processen gedigitaliseerd hebben.

En het gemak waarmee je een snapshop op opslag niveau buiten het toezicht van een organisatie kunt plaatsen is toch echt wel wat om ons zorgen over te maken als ik overweeg dat nog steeds het grootste deel van alle datalekken hieruit voortkomt. Wie het kleine niet leert doet het grote dan ook al snel verkeerd als ik kijk naar een fenomeen als bedrijfspionage, data is dus nog weleens de bruidschat.

Log in om te reageren
Henri Koppen schreef:

30 januari 2015 om 14:00

Peter Lake, je schrijft “Als de betreffende data gegevens bevat die kunnen herleiden tot een individu, is het verzamelen van zulke data die geen maatschappelijk nuttig doel heeft, sowieso niet toegestaan.”

Kun je die onderbouwen met een bron? Want dit gaat te kort door de bocht. En uiteraard heb ik ook best de artikelen gelezen over archiefwetten en Wbp, maar naast dat 99% van de bedrijven zich dan niet aan de wet houdt is er een heel groot deel schimmig. Iedere webshop met een account waarvan de klant dus 2 jaar niets gekocht heeft zou dan al vernietigd moeten worden. Daarnaast is het belangrijk *wie* de gegevens genereert en moet als je veel met big data sets doet die persoonsgegevens bevatten (ook het wat is al een discussie punten) kun je die ook gewoon aanmelden bij CBP al gebeurd dit bijna tot nooit bij MKB bedrijven.

Dus “’t verzamelen van zulke gegevens gewoon niet toegestaan.” is maar de halve waarheid. Daarnaast is veel data helemaal niet persoonsgebonden en is het uiteraard een goede praktijk om gegevens te anonimiseren.

Wat ik bijvoorbeeld voorstel is dat je een mapping tabel maakt. Aan de ene kant het ID welke je wel tot een persoon kan herleiden, aan de andere kant een ID die niet te herleiden is, maar waaraan je wel eigenschappen kunt koppelen zoals geslacht, en leeftijd in jaren. De grote dataset die dan door data teams gebruikt hebben alleen het “anonieme” ID. Je kunt hier tegeinbrengen dat er uiteindelijk persoonsgegevens gemaakt kunnen worden voor mensen met toegang tot die mappings tabel, maar dat proces zul je dus goed moeten afschermen zodat je hard kan maken wie wanneer die tabel heeft geraadpleegd. Versleutelen zou dan niet misstaan.

Binnen e-commerce is dit natuurlijk niet praktisch omdat je uiteindelijk klanten de juiste boodsschap op het juiste moment wilt sturen, maar ook daar kun je die mappingstabel gebruiken. Aan de anonieme kant laat je de berekening los, de resultaat set wordt verstuurd naar de “voorkant” en middels een geautomatiseerd proces gemaakt tot uitingen (email, direct mail, call center calls, et cetera). Je scheidt in feite de data analyse kant van de uitvoerende kant, maar nu maak ik er al weer een te technisch verhaal van.

Al met al moet je de privacy discussie los voeren van de bijvoorbeeld dit artikel anders sla je alles dood. Daarnaast is overheid de grootste illegale data graaier die dus datasets van verschillende entiteiten bij elkaar brengt met als voorbeeld de belastingdienst. Een zeer grove schending daarvan vind ik de belastingdienst die een parkeerdienst gaat vragen alles van zijn klanten op te lepelen.

Ook de Google Analytics die vaak door de privacy -moraal- ridders tot duivel benoemt wordt heeft zeer veel mogelijkheden om privacy te beschermen. Wees als bedrijf ook zo netjes om je klanten te informeren en dan is er wat mij betreft geen vuiltje aan de lucht.

Maar data is gewoon data. (Het zijn niet de kogels die doden, maar mensen).

Log in om te reageren
Ewoud D. schreef:

30 januari 2015 om 22:06

@Henri
Aangaande gebruik van Google Analytics en genoemde bewerkingsovereenkomst zie handleiding CBP:
https://cbpweb.nl/sites/default/files/atoms/files/handleiding_privacyvriendelijk_instellen_google_analytics_0.pdf

Verder denk ik dat discusseren met jouw weinig nut heeft omdat je steeds meer op Mohammed Saïd al-Sahaf gaat lijken, de ook als Baghdad Bob bekende maar niet erg geloofwaardige Iraakse minister van informatie. Je voorstel voor een ‘split brain’ door geweer (pseudo ID’s) en kogels (werkelijke ID’s) apart te leveren en dan te zeggen dat wapens niet doden is te makkelijk. Vergeet niet dat mijn eerste reactie naar jouw de vraag was waarom we zoveel data bewaren als deze geen doel dient. Terugkomend op de eerder genoemde scope creep, je vergelijk met kogels gaat scheef omdat kaliber bepaald waar je op gaat jagen. Als je persoonsgegevens gaat koppelen jaag je niet op lieve witte konijntjes en dat wetgeving een bommetje legt onder veel plannen van Big Data is geen nieuws als we overwegen dat als er geen uitdrukkelijke toestemming (opt-in) van de klant is verkregen persoonsgegevens verwijderd moeten worden als ze functioneel niet meer nodig zijn, het recht om vergeten te worden in Jip & Janneke taal.

Betreffende genoemde tabel met tot op de persoon herleidbare ID’s dien je daar zelfs kolommen in op te nemen waarbij je gegevens per cell kunt encrypten en decrypten. Daarmee raak ik IRMA project want waarom moet iemand mijn naam weten als alleen leeftijd functioneel benodigd is, NSTIC is min of meer de Amerikaanse tegenhanger en er zijn soortgelijke projecten wereldwijd te vinden. Vraag is natuurlijk wel wie die tabel gaat beheren want zwakke punt met huidige opt-in systeem is dat je geen opt-out hebt doordat dus niemand data weggooid. En alleen informeren dat je gegevens langer bewaart dan functioneel benodigd is niet genoeg. Je kunt dan ook beter woordvoerder ICT bij de VVD worden want je overtroeft niet alleen Baghdad Bob met je reactie maar ook Ton Elias. Kom niet aan met ‘usance’ aangaande onderwerp privacy want dat is een handelsterm die met door Peter genoemde TTIP van mensen dus lieve witte konijntjes maakt. Dat 99% van de bedrijven schijt heeft aan de wet lijkt me geen reden om ook maar een struikrover te worden, de moraal-ridders zijn hier namelijk eerder de klokkenluiders op het witte paard.

Het kan zijn dat je aanstoot neemt aan deze reactie maar je struikelt dan ook nog steeds over dezelfde steen terwijl de ezel – net als in het boek Animal Farm – wel kan lezen. Derdenverstrekking van persoonsgegevens is namelijk vaak ergens weggestopt in de voorwaarden terwijl een bewerkingsovereenkomst ontbreekt en de verantwoordelijkheid voor de privacy ongewijzigd bij gebruiker ligt.

Euh…. wat mis ik?

Oja, het rendabel maken van notoire wetsovertreders aan het kruis nagelen door overtredingen niet in pot Algemene Middelen van de staat te laten vloeien maar op bankrekening van gedupeerden. Zeg maar omgekeerd fiscaliseren want je opmerking aangaande de belastingdienst onderschrijf ik dan weer wel. Let’s fuck the system Kopenski, we nemen voor een paar tientjes een andere identiteit en gaan met Poolse nummerplaten rijden. Je opmerking over informeren is dan ook nogal lachwekkend als je niet weet hoe de hazen lopen;-)

Log in om te reageren
Roel Haverland schreef:

2 februari 2015 om 15:10

Beste heren,

Dank je wel voor jullie veelzijdige reacties op mijn artikel. Het ging me in mijn tekst niet om de discussie over privacy, maar ik heb het geschreven om een stuk bewustzijn te creëren bij mensen die nog niet zo in het onderwerp zitten. Aan jullie reacties te zien hebben jullie erg veel kennis over het onderwerp en dat gaat eigenlijk veel verder dan mijn betoog. Ik wilde vooral wat tips geven op het gebied wat mensen kunnen doen, daarom besluit ik ook met de tip dat mensen vooral niet moeten denken dat het een hype is, maar dat ze goed moeten nadenken over een strategie op dit gebied.

Mochten er verder nog vragen leven bij jullie, dan wil ik die vanuit mijn ervaring graag beantwoorden.

Log in om te reageren

Geef een reactie Reactie annuleren

Je moet ingelogd zijn op om een reactie te plaatsen.

15 reacties op “De do’s en don’ts op het gebied van big data”

Geef een reactie Reactie annuleren

Direct naar

Producten

Contact

Social

Whitepapers

Meer lezen

15 reacties op “De do’s en don’ts op het gebied van big data”

Geef een reactie Reactie annuleren

Footer

Direct naar

Producten

Contact

Social