Wie met data in aanraking komt, worstelt al gauw met een privacyprobleem, zeker als je gegevens uit verschillende bronnen wilt analyseren. Dat vooruitzicht bemoeilijkt samenwerkingen binnen sectoren. Bedrijven en instellingen durven geen data uit handen te geven omdat deze weleens in verkeerde handen kunnen komen.
Niet alleen malafide buitenstaanders vormen een gevaar maar ook insiders met verkeerde bedoelingen kunnen veel schade aanrichten. Datalekken zoals bij de GGD zijn daar een voorbeeld van.
Geen wonder dan ook dat technologie die de privacy vergroot en het datagedreven werken mogelijk maakt, momenteel veel aandacht trekt. Een van de meest belovende startups op gebied van privacytech is Roseman Labs uit Breda. Voortbordurend op werk van Berry Schoenmakers van de TU Eindhoven zijn cryptografen Toon Segers en Niek Bouman software op basis van secure multiparty computation (mpc)- technologie gaan ontwikkelen die gedecentraliseerde data-analyses op een veilige manier mogelijk maakt. Roderick Rodenburg, die veel ervaring heeft met de uitwisseling tussen bedrijven van gevoelige data, sloot zich bij dit duo aan. Hun technologie stelt organisaties in staat data te analyseren die in verschillende silo’s zitten opgeslagen en daar ook blijven. Deze data worden versleuteld om er vervolgens een berekening overheen te draaien.
Rodenburg noemt als voorbeeld drie ziekenhuizen die de gemiddelde leeftijd willen weten van coronapatiënten die op de ic belanden. Voorheen werden die data op een centraal punt bijeengebracht om ze te analyseren. Daarbij moest je maar hopen dat niemand met die data aan de haal ging.
Bij de methode van Roseman Labs blijven data op hun plek staan. Het algoritme reist als het ware langs de verschillende databases. Aan het begrip data soevereiniteit wordt concreet invulling gegeven. Iedereen blijft baas over de eigen data. Hoewel de gegevens volledig zijn afgeschermd, is toch sprake van volledige transparantie. Te controleren valt hoe de berekeningen tot stand zijn gekomen. Volgens Rodenburg wordt concreet invulling gegeven aan abstracte begrippen in de AVG zoals doelbinding en dataminimalisatie.
Bouwsteen
Roseman Labs biedt een engine aan voor veilige mpc, een cryptografische bouwsteen waar softwareontwikkelaars op kunnen voortborduren. Deze tool verhoogt de productiviteit van de betrokken werknemers. Ze kunnen sneller implementeren. Bovendien loste Roseman problemen rond de performance op. Mpc kenmerkte zich tot voor kort door een lage performance vergeleken met gewone data analytics. Als applicaties veel tijd nodig hebben om een bepaalde analyse te runnen, is dat niet interessant voor ai- en machine learning-toepassingen. De nieuwe engine maakt dat applicaties snel draaien en krachtig presteren. Dat maakt mpc bijzonder geschikt voor big data en ai.
Ontwikkelaars moeten echter nog wel cryptografische kennis hebben om dit soort applicaties te kunnen maken. Om die reden richt Roseman zich op ‘gevoelige’ use-cases waarbij hoge privacyeisen worden gesteld. Daar zijn de voordelen het grootst. Een belemmering hierbij is het beperkte aantal cryptografische experts. Daar is wereldwijd een groot gebrek aan.
Maar het Bredase bedrijf werkt aan een tool waarmee ontwikkelaars in de toekomst ook zonder deze specialistische knowhow applicaties in elkaar kunnen zetten. Rodenburg denkt daar twee tot vier jaar voor nodig te hebben. ‘Als geen experts meer nodig zijn, wordt deze techniek schaalbaar. Dan gaan dit soort oplossingen een hoge vlucht nemen,’ voorspelt hij.
Dreigingen en incidenten
Roseman Labs werd in maart 2020 opgericht. Launching customer van het Bredase bedrijf was het Nationaal Cyber Security Centrum (NCSC). De opdracht was meer mogelijkheden te bieden om informatie over cyberrisico’s veilig te kunnen delen, met als doel de digitale weerbaarheid van Nederland te vergroten. Het NCSC is nu in staat om het beeld van dreigingen en incidenten te versterken zonder dat zichtbaar is welke deelnemer aan het systeem de informatie heeft verstrekt. Met deze oplossing biedt NCSC de hoogst mogelijke privacygarantie aan zijn deelnemers.
In december ging Roseman samenwerken met Technolution om een opdracht voor een privacyproject bij een nationale netwerkbeheerder te doen. Hiermee kan een operator straks data van slimme meters aggregeren over meerdere huishoudens terwijl de privacy van individuele huishoudens gewaarborgd blijft. Roseman ziet ook toepassingsmogelijkheden voor zijn software bij medische zorgsystemen, de opsporing van mensenhandel en de bestrijding van witwassen.
Een andere use-case is ‘privacy-preserving device telemetry’. Fabrikanten van bijvoorbeeld computertomografie (ct)-scanners of wafersteppers (machines om chips mee te maken) lezen hiermee specifieke informatie over het gebruik terug zonder te zien wat de klant ermee doet. Zo is preventief onderhoud te optimaliseren. Rodenburg ziet het gebruik van privacytech op den duur mainstream worden en uitbreiden naar applicaties die minder gevoelig liggen.
Afgelopen januari deed Roseman Labs mee aan de virtuele techbeurs CES. Daarmee kwam de techniek onder de aandacht van een bredere doelgroep.
Man-vrouwverhouding
Mpc stelt meerdere partijen in staat efficiënt berekeningen uit te voeren op hun gecombineerde data. Elke partij leert niets buiten zijn eigen input en, indien toegestaan, de output van deze berekeningen. In het eerdergenoemde voorbeeld van de ziekenhuizen kan geen oneigenlijk gebruik van de data plaatsvinden. Andere gebruikers kunnen bijvoorbeeld niet naast het berekenen van de gemiddelde leeftijd ook nog eens de man-vrouwverhouding berekenen zonder goedkeuring van de dataeigenaren.
De mpc-techniek is ook toepasbaar binnen één organisatie wanneer er Chinese walls aanwezig zijn zoals bijvoorbeeld bij verzekeraars waar commercie geen inzicht mag krijgen in operationele klantgegevens. Tijdens of na de dataverzameling kunnen de gegevens in versleutelde vorm worden opgeslagen. Vervolgens voeren meerdere interne servers de veilige berekening uit op de versleutelde data. Daarbij zijn de data die ‘in rust’ zijn en de data ‘in gebruik’ zijn, volledig beschermd tegen pottenkijkers.
De eerste theoretische ideeën voor mpc dateren uit de jaren tachtig van de vorige eeuw. Door vooruitgang in fundamenteel onderzoek, en door de enorm gestegen rekenkracht en vooruitgang in computernetwerktechniek, is deze technologie sinds een paar jaar praktisch toepasbaar.