Bij het beschikbaar stellen van (open) data kan de overheid beter de nadruk leggen op de kwaliteit van deze data dan op de hoeveelheid. Aan het eerste schort het vaak. Daarom is het belangrijk om vooral in de kwaliteit van data te investeren.
Experts vanuit verschillende lagen van de overheid, wetenschap en bedrijfsleven kwamen met deze boodschap tijdens het congres ‘Data science voor maatschappelijke uitdagingen’ te Den Haag. Ook belangrijk is dat data via api’s goed benaderbaar zijn.
Centraal op dit congres georganiseerd door ScienceWorks stond de vraag hoe het gebruik van (open) data ‘ongetemde’ sociale vraagstukken het hoofd kan bieden. Voorbeelden zijn de problemen rond de schuldhulpverlening, voortijdige schoolverlaters en de kwaliteit van het oppervlaktewater. Met open data zoals wijk- en buurtcijfers valt beter te anticiperen op criminaliteit.
Kunstmatige intelligentie (artificial intelligence, ai), blockchain en allerlei nieuwe data analyse-instrumenten bieden overheden veel kansen om dergelijke vraagstukken beter te lijf te gaan. Maar het kan misgaan als een ai-systeem met data van lage kwaliteit wordt gevoed. Dan bestaat het gevaar dat uit zo’n ai-project verkeerde beslissingen volgen met alle nadelige consequenties.
Jacco van Ossenbruggen, onderzoeksleider bij het Centrum Wiskunde & Informatica (CWI) te Amsterdam, zei dat er geen vooroordelen in data mogen zitten. Anders kunnen daaruit niet de juiste inzichten worden gehaald.
Data op orde
‘Kunstmatige intelligentie en data zijn onlosmakelijk met elkaar verbonden,’ aldus Anja Lelieveld. Volgens deze topambtenaar bij het ministerie van Binnenlandse Zaken en Koninkrijksrelaties (BZK) is het daarom cruciaal dat vertrouwen kan worden gesteld in de kwaliteit van de gegevens.
Deze gedachte leeft inmiddels breed bij de overheid. We zien dit besef ook terug in de Nationale Data Agenda (NDA) ter verbetering van de overheidsdienstverlening. In deze overheidsbrede agenda die binnenkort gereed komt, behoort de bruikbaarheid van overheidsdata tot de topprioriteiten. Ook randvoorwaarden als basisregistraties, standaardisatie en regie op gegevens krijgen de komende jaren extra aandacht.
Het is nog een hele klus om de data van de overheid op orde te krijgen, aldus bleek op het congres. Zo bestaat er een overvloed aan lokale datasets. Maar die zijn niet allemaal even goed en betrouwbaar. Van de buitenkant is vaak moeilijk te zien wat wel en wat niet klopt. Zelfs het werken met ogenschijnlijk makkelijke data kan bij de overheid op een drama uitlopen.
Basisregels en communicatie
Prof. Bart Verheij, hoofd van de afdeling Artificial Intelligence bij de Universiteit Groningen, herinnerde in dit verband nog even aan het project Gemeentelijke Basisadministratie (GBA). ‘Door de diversiteit van systemen werd dit een totale mislukking,’ aldus Verheij. Hij noemde de migratie naar één basisadministratie personen dramatisch moeilijk. Probleem was onder meer dat vijf verschillende definities van adresgegevens werden gehanteerd. Zelfs de manier waarop namen worden gespeld, bleek uiteen te lopen. Volgens Verheij blijft het bij dit soort overheidsprojecten een probleem om alle betrokken partijen op één lijn te krijgen.
Ook zijn er voorbeelden dat partijen in dezelfde sector volledig langs elkaar heen werken. Het CDA-kamerlid Harry van der Molen vertelde dat het MCL-ziekenhuis in zijn woonplaats Leeuwarden met een geheel ander elektronisch patiëntendossier werkt dan de rest van de Friese ziekenhuizen. En dat terwijl in vrijwel dezelfde periode deze systemen werden opgezet. ‘Pas achteraf ontdekte men dat het MCL Epic gebruikt terwijl naburige ziekenhuizen met Chipsoft werken.’ Volgens Van der Molen kunnen veel fiasco’s worden voorkomen als van tevoren wat basisregels worden afgesproken. Dan zou de communicatie tussen dit soort systemen veel gemakkelijker kunnen verlopen.
Van der Molen zei dat met name op provinciaal en lokaal niveau het gebruik van open data nog heel beperkt is. ‘Alleen de grote jongens lukt dat,’ aldus het CDA-kamerlid. Kleinere gemeenten doen nog weinig met open data. Hij pleitte ervoor om van tevoren goed na te denken over het openstellen van data. ‘Anders krijg je systemen waar niets uit kan worden gehaald. Of systemen die niet met elkaar kunnen communiceren. Maar dit ligt vaak ook aan de ict-leveranciers.’
Burgers
Jaron Haas, projectleider van de eerdergenoemde Nationale Data Agenda, signaleerde een diepe kloof tussen de beleidsmedewerkers en de mensen die zich met data bezighouden. ‘Men kent elkaars werk niet, weet niet welke taak de ander heeft en spreekt elkaars taal niet,’ aldus Haas. Hij pleitte ervoor meer aandacht te geven aan het vergroten van het wederzijds begrip en co-creatie tussen beleidsmakers en dataspecialisten.
Ook komt het voor dat de ambtelijke cultuur een hinderpaal is voor open data. Paul Suijkerbuijk, open data expert bij ICTU, noemde als voorbeeld de data over het bomenbeheer. Sommige gemeenten proberen achterstallig onderhoud op dit gebied te verhullen uit angst voor claims. Maar juist als burgers kunnen zien waar bomen slecht zijn onderhouden, prikkelt dat om te melden als een boom gevaarlijk scheef staat. Dan kan tijdig worden ingegrepen.
Ook hekelde hij het risicomijdend gedrag bij ambtenaren. ‘Probeer eens als een burger te denken,’ zo hield Suijkerbuijk zijn gehoor voor. Hij verwees ook naar gevallen waarin ambtenaren niet helemaal begrepen hoe het gebruik van open data werkt. Zo wilde men volledig onterecht een site uit de lucht halen die op basis van open data inzicht gaf in de kwaliteit van het oppervlaktewater. Open data leidt niet altijd tot resultaten die ambtenaren welgevallig zijn. Maar daar zal men aan moeten wennen, aldus Suijkerbuijk.