Het jachtseizoen is geopend: bedrijven, nutsbedrijven, semipublieke dienstverleners en overheden zijn massaal in de ban van de jacht op ‘vette’ data (big data, cool data). Hoe meer hoe beter? Of vragen we ons binnen vijf jaar af hoe we in godsnaam van al die data afkomen? Data opslaan kost expertise, energie, beveiliging en huur of koop van opslagruimte.
Als het internet of things, dat allerlei apparaten en spullen op onzichtbare wijze met elkaar laat communiceren, doorzet, zal de hoeveelheid gedragsgegevens van producten, personen en toestanden binnen zeer korte tijd exponentieel toenemen. De vraag wordt dan niet hoe we nog meer data kunnen maken, opslaan, linken en vermarkten, maar precies omgekeerd. Wie het voor elkaar krijgt om slim te selecteren en geen oplossingen in data zoekt die in de ‘harde’ werkelijkheid sneller en beter kunnen, die heeft een competitief voordeel.
Big data analytics biedt soms fantastische mogelijkheden. Maar blind verzamelen en overhaaste inzet van die analytics zullen eerder verlies en gevaar opleveren dan winst. Een van die gevaren is het aantasten van allerlei grondrechten: privacy, maar vooral ook non-discriminatie en de onschuldpresumptie. Gedragsgegevens van consumenten worden massaal ingezet om hun toekomstig gedrag te voorspellen en te beïnvloeden.
Ook overheden hebben ontdekt hoe ze hun burgers op basis van gedragsgegevens in kaart kunnen brengen en bij de les kunnen houden. Daarbij lijkt het consentmodel voor het delen van persoonsgegevens volkomen uit de tijd. Mensen zijn zich niet bewust van de gedragsgegevens die ze volautomatisch delen en kunnen al helemaal niet meer voorzien wat daaruit wordt afgeleid en hoe dat hun leven gaat beïnvloeden.
Het wordt tijd dat we de cowboys in big data-land gaan temmen, en hen tegelijk helpen de wilde galop van rondrazende datakuddes te stuiten. Het grondbeginsel van gegevensbescherming is dan ook niet consent maar doelbinding. Wat ook de juridische grond is voor de gegevensverwerking, het doel van die verwerking moet duidelijk zijn en de verwerking moet nodig zijn voor dat doel. Anders is sprake van onnodige verwerking van persoonsgegevens en dat is gewoon verboden.
Doelbinding slaat aldus drie vliegen in één klap: het perkt de mateloze verwerkingsdrift in, het maakt de zaken weer overzichtelijk voor de eindgebruiker en het stelt degene die het doel bepaalt, en dus het verdienmodel of overheidsbeleid, verantwoordelijk voor de verwerking. De komende Verordening Gegevensbescherming zal, als die er komt, dit grondbeginsel van verantwoordelijke en narekenbare gegevensverwerking eindelijk afdwingbaar maken.
Wie zich er niet aan houden kunnen een maximale boete van 5 procent van hun wereldomzet tegemoet zien. Dat betekent dat gegevensbescherming een zakelijk belang wordt en eindelijk steun zal krijgen vanuit de top van ondernemingen. Dat zal niet zonder slag of stoot gaan en de soep zal niet zo heet gegeten worden als die wordt opgediend, maar het zal wel een verdere uitverkoop van grondrechten voorkomen, de datagekte indammen en nieuwe betekenis geven aan het aloude inzicht ‘less is more’.
Dit artikel is eerder verschenen in Computable magazine jaargang 48, nummer 3 van maart 2015.
Dat klinkt mooi “dat is gewoon verboden” maar wie gaat toezicht houden? De staat die zelf een grote verzamelaar is?
De mens wordt momenteel in big data gereduceert tot consument, daar heb ik wat op tegen.
We hebben regels nodig, die het weigeren om daar aan mee te doen, niet tot negatieve consequenties laat leiden.
Zoals je in de USA meer premie moet betalen als je niet wenst om je gegevens via facebook te delen met de verzekeraar.
Ook in Oostenrijk heeft de staat voor de ziektekosten-verzekeraar een opt-out regeling bij de centrale opslag van medische gegevens (ELGA) waar afmelden zo lastig is dat slechts weinigen dat doen.
Nog even en we landen daar waar IBM ooit een regime de perfecte registratie van religie gaf. Mensen zijn hardleers.
Hoewel ik de bezwaren van Jan kan begrijpen aangaande ‘zelfreinigende’ vermogen doordat melden van misstanden nog niet goed geregeld is denk ik dat hiermee in elk geval een bewustwording omtrent fenomeen data komt. Aangaande overzichtelijkheid voor eindgebruiker zet ik enige vraagtekens omdat deze zich niet bewust is van wat Personal Identifiable Information (PII) aangaande alle digitale identiteiten eigenlijk precies is.
Nu is dat een discussie over de regels en de geest van de wet maar als uit mijn naam, rang en registratienummer ook geboortedatum en geslacht te halen is zegt dat iets over patronen in de niets lijkende cijferreeksen. Ben een beetje autistisch maar het 1+1=3 maakt het verschil tussen een jurist en een analist, onderzoek van Matthijs Koot over ‘quasi identifiers’ toonde onachtzaamheid aan betreffende mogelijkheden van wiskundige formules. Alles draait om de verwerking en zolang slager zijn eigen vlees blijft keuren kan ik me dus iets voorstellen bij de bezwaren van Jan.
Ik denk dat het verzamelen van data nog niet echt het grote punt is. Immers de data is er al, er worden alleen via algoritmes combinaties gemaakt. Er zit meer een ethische vraag aan het gebruik van de hoeveelheid data. We moeten dus niet de bron in het kwade daglicht stellen, maar het gebruik ervan. Heel veel data ligt al feitelijk in het publieke domein, en het is het aan de aanwender van die data hoe er mee om te gaan.