DATAREVIVAL – Met de introductie van ai in belangrijke bedrijfsprocessen krijgen we te maken met nieuwe uitdagingen rond de omgang met persoonsgegevens. Verrassend daarbij is dat in Nederland het UWV vooroploopt, maar zich niet bewust lijkt van de risico’s die dit met zich meebrengt.
Niemand zal het doen, maar wie wil kan mijn ict-schrijfsels sinds 1993 aan een ai-model aanbieden om daarna Datarevival-columns van achthonderd woorden te laten genereren. Is wat wordt gegenereerd dan spam? Plagiaat? Oplichterij? Auteursrechtschending? Identiteitsdiefstal? Het is voer voor filosofen en juristen – en de eerste rechtszaken zijn al aangespannen door de New York Times en sterauteurs als John Grisham en Stephen King.
Over naar Nederland. Ons UWV is begonnen om de switch naar ai te maken met een mega-ict-project. Het systeem Werk.nl dat cv’s van werkzoekenden koppelt aan vacatures van werkgevers wordt herbouwd op basis van software van ai-aanbieder 8Vance. Dat belooft veel goeds, ook omdat de matching-software die UWV al een kwart eeuw gebruikt slecht functioneert. Het bedrijf zegt de ai te hebben getraind op maar liefst 85 miljoen persoonsprofielen, waarvan zeven miljoen Nederlanders, die zij van LinkedIn heeft gescrapet (ja, ook uw LinkedIn-profiel.) De vraag is nu natuurlijk: mag dat zomaar? En afgeleid: heeft UWV haar huiswerk wel gedaan?
Volgens recruitment-expert Marc Drees schendt 8Vance vergaand de regelgeving van de AVG en is wat ze doen daarnaast strijdig met de LinkedIn-gebruiksvoorwaarden. UWV doet alsof haar neus bloedt. Het is na te lezen op Drees’ blog. Ik ben geen jurist, maar ook mijn indruk is dat UWV grote risico’s loopt. Maar ook: als wat UWV doet juridisch mag, dan is dat baanbrekend voor de adoptie van ai in Nederland. Ik bevind mij in kamp UWV. Ik weeg het ongevraagde gebruik van mijn openbare LinkedIn-gegevens voor ai-trainingsdoeleinden af tegen het belang van een beter werkende arbeidsmarkt. Gebruik vooral mijn data, maar wel alleen voor trainingsdoeleinden. Maar ik ben niet de wetgever en als UWV straks wordt teruggefloten is de economische en reputatieschade groot. Wat dat laatste betreft: stel je voor dat LinkedIn (Microsoft) straks een claim neerlegt bij UWV voor ongeoorloofd gebruik van ‘zijn’ data?
Profielendatabase
Wat mij vanuit data-perspectief interesseert, is wat er straks gaat gebeuren met de persoonsgegevens die Nederlandse werkzoekenden in Werk.nl stoppen. UWV heeft vanouds een profielendatabase, maar de matching met vacatures vindt plaats in een eigen database van de leverancier. Hoe die database eruitziet is bedrijfsgeheim. UWV stopt straks persoonsdata die cliënten verplicht moeten opgeven in een complete blackbox. De enige, zwakke, garantie die werkzoekenden hebben. is dat database en software bij UWV in huis staan. Los van de AVG-wetgeving is dit soort oncontroleerbare ai precies wat politici en privacybeschermers niet willen.
UWV stopt straks persoonsdata die cliënten verplicht moeten opgeven in een complete blackbox
Wat het pikant maakt, is dat de leverancier de matchingsoftware ook voor commerciële partijen wil inzetten. De persoonsdata in Werk.nl zijn goud waard en omdat Werk.nl een zwaar verouderde data-grabbelton is, worden die voortdurend gescrapet door commerciële partijen. Die willen, net als UWV, mensen aan werk helpen maar dan betaald. Zonder dat ik iemand beschuldig, maak ik mij zorgen over wat UWV contractueel, procedureel en technisch heeft geregeld om te voorkomen dat één commerciële partij straks de hand kan leggen op persoons- en arbeidsmarktdata die buiten UWV zelf niemand heeft en die direct en indirect goud waard zijn.
Wenselijk
Dát de softwareleverancier UWV persoonsdata in handen krijgt is waarschijnlijk en zelfs wenselijk. Het ai-algoritme moet blijvend worden getraind en het UWV beschikt over kwalitatief veel betere persoonsprofielen dan LinkedIn. Van 2012 tot 2017 was ik verantwoordelijk voor het bewaken van de datakwaliteit in Werk.nl en de 2,3 miljoen (!) unieke cv’s die langskwamen, waren overwegend van uitmuntende kwaliteit en zeker stukken beter dan wat LinkedIn heeft te bieden. Het zou bizar zijn als deze informatie straks niet wordt gebruikt om de matching door UWV te verbeteren en actueel te houden. Het probleem daarbij is niet alleen dat één commerciële speler dan alsnog persoonsdata onder zich krijgt, maar ook dat een commercieel bedrijf dan beschikt over een matchalgoritme dat superieur is aan alles waarover de concurrentie beschikt. Commerciële bemiddelaars stappen dan naar de rechter, als toezichthouder ACM al niet eerder heeft ingegrepen.
Wat er bij UWV gebeurt, is dus niet alleen interessant voor juristen en privacyclubs, maar ook voor liefhebbers van faire concurrentie en fatsoenlijk gebruik van data voor ai-innovaties. Het lijkt erop dat ze bij UWV zelf niet goed beseffen wat er speelt en welke risico’s ze lopen. Laten we hopen dat medewerkers bij het UWV en in Den Haag alsnog wakker worden. Maar hoe dan ook heeft dit innovatieve ai-project alles in zich om op de voet te worden gevolgd door ict’ers, juristen, economen, toezichthouders en politici. Ik houd u op de hoogte via Computable.nl.
Naschrift: Recruitment-expert Marc Drees laat op zijn blog weten dat het UWV naar aanleiding van zijn vragen een externe partij op korte termijn een audit laat uitvoeren. Daarbij wordt onder meer getoetst of 8Vance voldoet aan de AVG. Zie ook mijn LinkedIn-bericht.
door linkedin bewust aangeboden publieke data die gekopieerd wordt.
Als linkedin daarna die openbare info verwijdert, lijkt met het vreemd dat ze anderen kunnen verbieden die data te gebruiken.
Gaat er toch iets mis, dan ligt het voor de hand dat 8Vance verantwoordelijk is, want waarom huur je zo’n partij anders in.
Is UWV toch medeverantwoordelijk wat dan, gaan ze dan failliet ? 😛
“Het lijkt erop dat ze bij UWV zelf niet goed beseffen wat er speelt en welke risico’s ze lopen.”
Inderdaad, audit uitvoeren en opgelost.
René gooit weer van alles door elkaar om zijn oude broodheer te kunnen bashen want een functieprofiel is generiek waarin de generatieve AI voor een buzzword bingo zorgt. Uitmuntende kwaliteit van CV’s in periode 2012 tot 2017 zorgt dan ook niet voor een betere match tussen de
‘in between job’ profielen en recruiters in 2024 doordat de markt niet stil is blijven staan. Aangaande toegang tot de kaartenbak van UWV en regie op je eigen data in LinkedIN is de gebruiker eigenaar van zijn of haar persoonlijke informatie die op LinkedIn wordt verstrekt.
LinkedIn heeft bepaalde verantwoordelijkheden met betrekking tot het beheer en de bescherming van deze gegevens volgens hun privacybeleid en de geldende wet- en regelgeving maar juridische vraag hierin gaat meer over het doel gaat. Privacy is namelijk subjectief want niemand zal bezwaar tegen het gebruik van persoonsgegevens maken als daaruit een voordeel komt, de slechte reputatie van het UWV als uitkeringsfabriek gaat dus meer om het nadeel.
Never waste a good crisis lijkt een recruitment-expert vooral spijkers op laag water te zoeken want hoewel het goed is dat er toezicht gehouden wordt op AI blijft het selecteren mensenwerk. De selectie beperkt zich tenslotte alleen maar tot potentiële kandidaten die nog gescreend moeten worden voor de job.
Ik zie dit soort berichten met verbazing langskomen en ben het helemaal met Rene eens. Als het UWV, met haar grote maatschappelijke belang en inzicht in de persoonlijke gegevens van heel veel Nederlanders een proef gaan doen met AI, dan verwacht ik dat zij in datzelfde bericht precies uitleggen hoe ze aan die data komen, dat ze daar de de nodige goedkeuringen voor hebben gekregen en wat ze precies met gegevens doen als deze bij de bron aangepast worden.
Want als zo’n model, gebaseerd op 85 miljoen profielen 6 maanden oud is, dan is zo’n 5% van de brongegevens al weer gewijzigd. En wat gebeurt er met al die opgepoetste profielen op LinkedIn? Wegen die minder zwaar dan de in eigen beheer ontvangen profielen en CV’s?
Ik verwacht van een ZBO 100% duidelijkheid over dit soort zaken, zeker als bekend is dat gegevens ook door derden gebruikt gaan worden..
@Marcel, veroudering van die data is als het goed is niet van belang. Het gaat om eruit verwerven van intelligentie die er hopelijk in besloten ligt. Het kan natuurlijk zijn dat AI alleen maar als steekwoord voor de marketing is gebruikt. In dat geval is veroudering eventueel wel van belang. Opzetten van Data Warehouses en Data Mining werd vaak ook alleen maar managementrapportage mee geleverd in plaats van nieuwe inzichten. Iedere periode vraagt zijn eigen terminologie bij overheden.
Tenzij het als ge-pseudonimiseerde Open Data publiekelijk werd gepubliceerd, vind ik het overigens niet kunnen dat een ZBO dat op deze manier doet. Een ZBO heeft in een bevoorrechte positie deze informatie vergaard. Wellicht geeft het een voordeel als profielen en vacatures één op één kunnen worden gekoppeld aan personen, werkgevers en dienstbetrekkingen maar ik kan me bij AI-training ook voorstellen dat dat helemaal niet nodig is.