Een geboortedatum en de vier cijfers van een postcode zijn voldoen om in 67 procent van de gevallen geanonimiseerde gegevens trefzeker terug te leiden tot een persoon. Dat constateert wetenschapper Matthijs Koot in een grootschalig onderzoek het de-anonimiseren van digitale gegevens. Koot promoveert op 27 juni 2012 op dit onderzoek aan de Universiteit van Amsterdam.
Elk gegeven over een geïdentificeerde of identificeerbare persoon is volgens de Nederlandse privacywetgeving een persoonsgegeven. Om een database met persoonsgegevens te anonimiseren kan die data worden ontdaan van burgerservicenummers en persoonsnamen. Er is dan geen sprake meer van ‘geïdentificeerde' personen. Matthijs Koot onderzocht wanneer er ook geen sprake meer is van ‘identificeerbare' personen. Zijn onderzoek beantwoordt vragen als ‘Hoe anoniem zijn geanonimiseerde gegevens?' en ‘In hoeverre is het mogelijk geanonimiseerde gegevens te de-anonimiseren?'
Koot deed een grootschalige empirische studie naar identificeerbaarheid van Nederlandse burgers via deelcombinaties van postcode, geslacht en geboortedatum. Daaruit blijkt 67 procent van de onderzoekspopulatie uniek identificeerbaar binnen Nederland op basis van de vier cijfers van de postcode in combinatie met geboortedatum. Deze gegevens zijn vaak te vinden in profielen op sociale media.
Promotie
De promotie is gratis bij te wonen op 27 juni 2012 om 10.00 uur in de Agnietenkapel aan de Oudezijds Voorburgwal 231 in Amsterdam. 's Middags geeft privacy-expert Latanya Sweeney van de Harvard University een lezing over privacykwesties rondom digitale vooruitgang. De lezing begint om 14.00 uur in de VOC-zaal van het Oost-Indisch Huis, Kloveniersburgwal 48, Amsterdam.
Het is een interessant onderzoek, los van de onderbouwing van de conclusie, is de essentie dat het woord “anoniem” gradaties heeft gekregen en dat met zeer beperkte, ook nog eens, openbare gegevens iemand met zijn omgeving vrij goed traceerbaar is. Dit nog aangevuld met wat minder openbare gegevens is er tot op individueel niveau veel, eigenlijk indirect alles zichtbaar.
Kortom: van big data naar small privacy.
Een mooie aanvulling op de reeds jaren lopende discussie over data, privacy, anonimiteit, PET en – last but not least – testen.
Governance&Compliancy verdringt langzaamaan de laconieke houding m.b.t. privacy en IT.
Een Engelstalige versie van Matthijs’ dissertatie kan worden gedownload vanaf zijn weblog blog.cyberwar.nl
Tuurlijk is zorgvuldigheid en goede bescherming van privacy van belang. Maar soms wordt er ook te spastisch over gedaan. Als iemand wil weten waar ik woon, wat mijn naam is en wanneer is geboren ben, vergaat daarmee niet de hele wereld voor mij. En zoals gezegd: bij veel mensen is e.e.a. ook via de social media te herleiden dus laten de mensen ook eerst bij zichzelf beginnen i.p.v. te mekkeren.
@Henry. Ik denk dat het niet erg is als mensen jou zoeken omdat ze je lang niet gezien hebben. Het wordt anders als een bedrijf waar jij min of meer gevoelige gegevens aan hebt verstrekt zijn bestanden geanonimiseerd doorspeeld aan andere bedrijven of instanties. Wellicht is het dan minder prettig als deze data op basis van je geboortedatum en postcode weer aan jou gelinked kan worden.
Waarschijnlijk doet dit artikel geen recht aan zijn promotieonderzoek, maar de conclusie dat individuen kunnen worden geïdentificeerd aan de hand van de geboortedatum en postcode is natuurlijk niet heel schokkend. Dit zijn namelijk de meest identificerende gegevens, die voor de naaste omgeving publiekelijk beschikbaar zijn.
Wanneer deze gegevens niet geanonimiseerd zijn en er een relatie bestaat met privacy gevoelige gegevens (bv. financiële en medische historie), kunnen betrokkenen nog steeds schade ondervinden.
Conclusie; anonimiseren begint bij de geboortedatum en adres gegevens!