Zorgen dat burgers en bedrijven vrijwillig en correct belasting betalen. Om dit te realiseren, zet de Belastingdienst vol in op artificial intelligence (ai). ‘Er heerst veel wantrouwen over big data en ai en wij moeten heel transparant zijn’, vertelt ’analytics’-directeur Hans Timmermans. Een gesprek over technologie, ethiek en innovatie.
Een epicentrum van toegepaste ai in Nederland. Zo omschrijft directeur Hans Timmermans ‘zijn’ Belastingdienst-onderdeel Datafundamenten & Analytics (DF&A). In vergelijking met andere overheidsinstanties is de fiscus vergevorderd met de slimme inzet van data. Bijvoorbeeld met algoritmes die uit big data fraude herkennen en het contact met de burger verbeteren.
U leidt sinds 2017 de directie Datafundamenten & Analytics. Wat is dat?
Timmermans: ‘DF&A is een van de 23 directies van de Belastingdienst. Elf zijn actief in het primaire proces, een aantal houdt zich bezig met beleid en de rest is ondersteunend. Wij ondersteunen met diverse diensten en producten de processen van belastingheffing, inning en klantinteractie, zoals de belastingtelefoon. We zijn nu met 280 medewerkers, waarvan vijftig externen.
Onze teams zijn betrokken bij de gehele ontwikkelketen, dus van probleemanalyse en innovatie tot exploitatie van de eindproducten. Enerzijds koppelen we beschikbare data en maken deze gereed voor analytics, specifiek voor de Belastingdienst. Anderzijds ontwikkelen we onze eigen producten aan de hand van die big data. Het gaat daarbij om advanced analytics: beschrijvende, diagnostische, voorspellende en voorschrijvende analytics.’
Hoe zet de Belastingdienst artificial intelligence in?
‘De strategie van de Belastingdienst richt zich op compliance: het verleiden van burgers en bedrijven om vrijwillig en correct belasting te betalen. We houden hierop toezicht, maar hebben te weinig resources om alles handmatig te controleren. Om het toezicht gerichter in te zetten, gebruiken we tegenwoordig ai met behulp van persoons- of bedrijfsgebonden data.
We zetten de technologie bijvoorbeeld in om te achterhalen welke aangiften we onder toezicht moeten plaatsen. Het zijn de aangiften waarvan wij vermoeden dat ze niet juist zijn. We gebruiken het ook om tijdens het inningsproces vorderingen te selecteren waarbij iets te halen valt. Met ai kunnen we bovendien mogelijke btw-fraude herkennen. We maken patronen en netwerken inzichtelijk, waardoor we fraude sneller en beter kunnen duiden en aanpakken. Daarnaast gebruiken we de data voor eenmalige analyses, bijvoorbeeld om Tweede Kamer-vragen te beantwoorden.’
Hoe ziet jullie ai-omgeving eruit?
‘Wij hebben twee soorten databronnen: de basisregistraties van de overheid en onze interne data. De basisregistraties zijn bijvoorbeeld de bestanden van de KvK, de Basisregistratie Personen en het Kadaster. De interne data zijn gegevens die bekend zijn bij de Belastingdienst, zoals de belastingaangiften. Bij elkaar ontsluiten we ongeveer 190 bronnen. Dat is aanzienlijk. Wij krijgen regelmatig updates uit die bronnen. Alle data zijn realtime beschikbaar in onze analytics-omgeving.
‘De analytics-omgeving is vrij standaard. We gebruiken SAS als analytics-tool en Teradata voor de dataopslag. Daarnaast hebben we een data science-toolbox. Dat is een soort sandbox, een geïsoleerde it-omgeving waarin we met open source-tooling kunnen experimenteren. De toolbox staat niet in productie, maar stelt onze medewerkers wel in staat om andere software dan SAS te gebruiken. Niet elke data scientist die wij werven, is bekend met onze standaard tools.’
Hoe lang gebruiken jullie al ai?
‘Mijn voorgangster heeft ai bij de Belastingdienst op de kaart gezet. Zo’n vijf jaar geleden is het idee ontstaan. De eerste twee jaar bestonden uit het ontdekken welke data op welke wijze konden worden ingezet. De laatste drie jaar staan in het teken van analytics gebruiken, uitbreiden en implementeren. Inmiddels spelen onze producten een belangrijke rol in diverse primaire processen van de Belastingdienst. Ik beschouw ons als een epicentrum van toegepaste ai in Nederland.
Alle uitkomsten die onze systemen genereren, zijn adviezen. Uiteindelijk besluiten de collega’s in de primaire processen hoe ze met deze adviezen omgaan. Er is geen sprake van geautomatiseerde besluitvorming. Toch is de impact groot als onze systemen het niet doen. Twee jaar geleden gingen we een tijdje op zwart en toen moesten we terug naar de oude werkwijze.’
Uw afdeling was negatief in het nieuws over databeveiliging. Wat is er gebeurd?
‘Zelf zit ik er nu 2,5 jaar. Mijn voorgangster was net vertrokken na een kritische reportage van Zembla. De reportage ging onder meer over ontoereikende databeveiliging binnen het team. Dit leidde tot Kamervragen en diverse onderzoeken. Na doorvoering van diverse maatregelen, waren de conclusies dat de privacy en databeveiliging op orde waren en dat iedereen het belang van advanced analytics bij de Belastingdienst onderkende. Toen konden we doorstarten.
Het is cruciaal dat onze databeveiliging op orde is en blijft. Onder meer de Algemene Rekenkamer heeft hierop een onderzoek uitgevoerd. We nodigen ook zelf externe partijen uit om ons hierop te controleren. Wij zijn voortdurend op zoek naar de dialoog en willen blijven leren en verbeteren.’
Er is ook discussie over de impact van overheids-ai op privacy, discriminatie en mensenrechten. Wat vindt u hiervan?
‘Er heerst veel wantrouwen over big data en ai, zeker als het gaat om de inzet bij de overheid. De abstractheid van het onderwerp geeft vleugels aan angst. Door duidelijkheid te geven, halen we de angst weg. Om die reden moeten wij heel transparant zijn; uitleggen waarom we ai inzetten en wat we ermee doen. Mensen moeten weten dat onafhankelijke controleurs de feitelijke algoritmen controleren en daarover publiceren.
Artificial intelligence is onderwerp van een groter politiek debat. De Wetenschappelijk Raad voor het Regeringsbeleid startte vorig jaar een onderzoek naar de impact van ai. Er wordt ook onderzocht welke waarborgen de overheid moet geven bij de inzet van de technologie. Aan welke eisen moeten dergelijke modellen voldoen? Hoe vergroot je acceptatie van ai in de maatschappij? Wij zoeken de dialoog op en kijken hoe we een bijdrage aan het debat kunnen leveren. En we nodigen mensen uit om te komen kijken hoe we het doen.’
Hoe gaat uw team om met deze ethische vraagstukken?
‘Wij moeten ons hoe dan ook aan de wet houden. Die is leidend. De wet bepaalt of iets mag. De politiek of de Belastingdienst zelf bepalen of we het willen. Dit is afhankelijk van het thema. Ten slotte geven wij als Datafundamenten & Analytics aan of we het kunnen. Voor elk project doen wij zo’n willen-mogen-kunnen-toets. Willen we dit, mogen we dit en kunnen we dit?
Het gaat erom hoe je ethische kwesties bespreekbaar maakt in het werk. Dit vraagt om transparantie en betrokkenheid, ook op de werkvloer. Een leidende vraag is: krijgt elke belastingplichtige de aandacht die hij of zij verdient? Mensen snappen dat we de boefjes proberen te pakken. Als maatschappij willen we immers dat iedereen netjes belasting betaalt. Maar mensen maken ook fouten, waardoor ze belasting zouden moeten terugkrijgen. Hiervoor gaan wij ook ai-modellen bouwen. Dit zijn politieke keuzes die leiden tot aanpassingen in de handhavingsstrategie bij de Belastingdienst.’
Hoe ziet u de toekomst van ai binnen de fiscus en binnen de overheid?
‘Dat is een lastige vraag, omdat dit snel politieke thema’s raakt. Het vakgebied ai is nog volop in ontwikkeling. Ik zie veel potentie om met ai onze uitdagingen op te lossen. Binnen de Belastingdienst ontstaat een domino-effect. Nu we daadwerkelijk werken met de uitkomsten van ai-modellen bij toezichttaken, zien collega’s mogelijkheden bij andere processen, zoals inning, handhaving en dienstverlening.
Zo zijn we bezig om doelgroepen te definiëren bij onze klantinteractie, die we gebruiken bij het nabellen van aanmaningen. De effectiviteit was laag en nabellen leidde lang niet altijd tot meer betalingen. Met behulp van analytics achterhalen we bij welke doelgroep nabellen wel werkt. Ook gaan we onze fraudemodellen inzetten voor controle aan de voorkant. Op die manier kunnen we bijvoorbeeld frauduleuze btw-carrousels voorkomen.
In de verdere toekomst krijgen analytics mogelijk een rol in de effectmeting van wetgeving. Dan worden de doelstellingen vooraf gekwantificeerd, de wetten gekoppeld aan algoritmes en de voortgang gemonitord.
Wat in de toekomst ook meer kan spelen, is data-uitwisseling tussen de Belastingdienst en andere partijen. Dit is best complex, onder meer door de Algemene Verordening Gegevensbescherming. Door de juiste uitwisseling, zoals met gemeentelijke diensten en het Centraal Justitieel Incassobureau, zouden we bijvoorbeeld een vollediger beeld krijgen van mensen met problematische schulden en hen daarmee misschien effectiever helpen. We zouden een voorspellingsmodel kunnen maken dat signaleert wanneer iemand mogelijk in geldproblemen raakt. Het kan allemaal, maar vereist maatschappelijke discussie en consensus. Transparantie is daarbij belangrijk.’
Hoe zorgt u ervoor dat uw directie DF&A blijft innoveren?
‘De Belastingdienst is een organisatie die al honderden jaren bestaat. We hebben soms de neiging om voor nieuwe problemen oplossingen te bouwen op de bestaande infrastructuur. Dat is niet altijd de beste weg. Door capaciteit en tijd te reserveren voor innovatie en zelf met goede ideeën te komen, komen we verder.
Innovatie heeft bij DF&A al een centrale plek. Zo organiseren we vier maal per jaar een driedagenchallenge. Medewerkers die een probleem of een idee hebben, koppelen we aan een team van data scientists dat een oplossing bedenkt en presenteert. Het is niet erg als de oplossing mislukt. Achteraf gooien we alles weg, maar we behouden de kennis. Voor deze challenge nodigen we andere instellingen uit, zoals UWV en de Nationale Politie. Daarnaast organiseren we het Conceptlab, waarbij je een idee pitcht voor een jury. Vinden zij het idee goed, dan mag je het uitwerken onder werktijd. Eerst drie uur, dan drie dagen, drie weken en daarna zelfs drie maanden. Zowel ervaren als jonge medewerkers nemen hier aan deel.
Mede door onze focus op innovatie lukt het om jonge, hoogopgeleide medewerkers te werven. Hierdoor ligt de gemiddelde leeftijd in onze teams veel lager dan het gemiddelde van de Belastingdienst. Er is aardig wat interesse om bij ons te werken. Veel geïnteresseerden zien het maatschappelijk belang. We hebben een van de mooiste databergen van Nederland en je werkt aan mooie projecten waarvan je veel leert.’
(Dit artikel staat ook in Computable-magazine # 06/2019.)
Infosecurity.nl en Data & Cloud Expo
Hans Timmermans spreekt tijdens de vakbeurzen Infosecurity.nl en Data & Cloud Expo. Zijn keynote vindt plaats op 30 oktober om 11.00 uur in Theater 1. Tijdens zijn presentatie over ai, data en analytics bij de Belastingdienst gaat hij in op de techniek, toepassingen en effecten. Hij vertelt over privacy en beveiliging en geeft een inkijkje in onder meer risico- en schaalmodellen. Ontdek hoe één van de grootste uitvoeringsorganisaties van Nederland omgaat met data-analyse en een epicentrum voor toegepaste ai in Nederland vormt.
Mooie praatjes vanuit de luie stoel, maar voorlopig is “if in-gevangenis then niet-uikering-geven” nog een stap te ver
Dit is wel een hele mooie voorstelling van zaken. Van de 280 man doet misschien een handje vol iets met predictive analytics. En om dat nou gelijk AI te noemen.
De rest houd zich bezig met business rules in Sas DI studio