Een nationale data-steward, een overheidsbrede data-strategie en -standaarden en een datacatalogus. Dat zijn voorstellen waarmee de rijksoverheid de inzet van data tijdens crisissituaties kan verbeteren. Ze komen uit de koker van het Centraal Bureau voor de Statistiek (CBS) dat onderzocht hoe de overheid op basis van betrouwbare gegevens snel beslissingen kan nemen tijdens rampen
Overheden moeten in een crisissituatie knopen doorhakken, maar beschikken tijdens zo’n noodsituatie niet altijd over betrouwbare data of weten niet waar en hoe ze die gegevens snel kunnen vinden of uitwisselen. Het CBS onderzocht samen met het nationale statistiekbureau van Canada de mogelijkheden om de datakwaliteit in crisissituaties te verbeteren en komt met aanbevelingen.
‘Datagedreven crisisrespons door de overheid vraagt om een goede overheidsbrede datastrategie, die vastlegt wat de rollen en verantwoordelijkheden van de verschillende overheden zijn’, schrijft het CBS. Het heeft een visie-document met aanbevelingen opgesteld. Daarin wordt naar voorbeeld van Nieuw-Zeeland gepleit voor een nationale data-steward, het gebruik, beheer en de beveiliging van alle overheidsdata aanstuurt
Corona
Als voorbeeld van een situatie waarin een data-steward nuttig is, noemt CBS de coronacrisis. ‘Deze crisis raakt de hele maatschappij en brengt veel onzekerheden met zich mee. Tegelijkertijd is er veel nepnieuws, terwijl de behoefte aan betrouwbare informatie juist groot is. Betrouwbare informatie is nodig om de crisis beleidsmatig goed aan te pakken, wetenschappelijk onderzoek te doen én om te weten hoe je als maatschappij met de situatie om gaat.’ De data-steward organiseert en borgt processen die ervoor zorgen dat de juiste data – van de nodige kwaliteit en betrouwbaarheid – op een veilige manier en op het juiste moment bij de juiste gebruiker beschikbaar zijn.
‘Geen tijd voor enquêtes’
Een andere aanbeveling gaat over de data-infrastructuur en -technologie. De statistici beschrijven in het visiedocument dat standaardisatie van technologie en processen belangrijk is om snel te kunnen handelen bij crises. Een data-ecosysteem waarin verschillende organisaties zoals overheidspartijen en kennisinstellingen op basis van standaarden kunnen samenwerken, zorgt dan voor meer flexibiliteit.
Ook wijzen ze in dit verband op de noodzaak om nieuwe databronnen aan te boren. ‘Primaire waarneming met enquêtes duurt in tijden van crisis vaak te lang. Je moet secundaire bronnen van partners juist dan snel kunnen binnenhalen. Een data-ecosysteem biedt daarvoor meer mogelijkheden.’
Datacatalogus
De samenstellers van het visiedocument pleiten ook voor een landelijke datacatalogus waarin data beschikbaar zijn volgens het fair-principe: findable, accessible, interoperable en reusable. Nederland heeft een open dataportaal van de overheid. Daarin worden datasets met openbare informatie gedeeld voor algemeen gebruik. Henning denkt dat een overheidsbrede catalogus, die transparant maakt over welke andere data de overheid beschikt, een goede aanvulling is.
‘In zo’n datacatalogus staan niet de data zelf, maar is beschreven welke data waar beheerd worden. Daardoor weten overheidsorganisaties van elkaar beter welke data beschikbaar zijn en hoe zij nóg meer datagedreven kunnen werken.’
Toolkit
Samen met het statistiekbureau van Canada zal het CBS de uitkomsten van het visiedocument breed onder de aandacht brengen, onder meer op online-congressen.
Er zijn bovendien plannen om het document uit te werken tot een toolkit die ook andere statistische bureaus kunnen inzetten bij het opzetten van ‘effectief data stewardship’.
…en dan is een link naar dat document wel zo handig: pagina https://www.cbs.nl/nl-nl/corporate/2022/01/het-belang-van-betrouwbare-data-in-tijden-van-crisis geeft een beschrijving.
Directe link is https://www.cbs.nl/-/media/_pdf/2022/02/cbsstatcan-2021–a-crossnational-view-on-nsos-and-data-stewardship-in-times-of-crisis.pdf
Dank voor de link Rob van Dort, de vragen die ik had over privacy worden hierin beantwoord. Want poportionaliteit van never waste a good crisis en grondwettelijke rechten zoals privacy blijft een listig aspect. Niet onmogelijk maar wie link naar PDF opent en zoekt op privacy ziet dat er nog wat werk in het ‘poetsen’ van de data zit. En wat betreft het koppelvlakkencircus is het exporteren van data niet de uitdaging zoals een oud maar nog altijd goed visiedocument van de WRR laat zien. De huidige ophef over de adresgevens van kamerleden is amusant als deze door de Kamer van Koophandel gelekt zijn. Jammer dat ze niet dezelfde zorg over de gegevens van ondernemers hebben als over fakelmans zonder witte puntmuts.
Aangaande het fair-principe, de moderne wetenschap van datasynthese kent nogal wat hocus-pocus met modellen die vanuit een algoritme de toekomst proberen te voorspellen met uiteindelijk de betrouwbaarheidsmarge van een politieke belofte. Of zoals Godfried Bomans het ooit verwoorde: “Een statisticus waadde vol vertrouwen door een rivier die gemiddeld één meter diep was. Hij verdronk.”
Interessant voorstel van het CBS. Statistiek is belangrijk bij beleid, ook bij crises beleid. En als je statistiek gebruikt, doe het dan wetenschappelijk verantwoord en zo netjes als mogelijk.
Gelukkig is de taalkunde na Godfried Bomans ook volwassen geworden en hebben taalkundigen tegenwoordig ook verstand van bijvoorbeeld de t-toets, variantieanalyse, regressie analyse.
Zoals gewoonlijk ziet de cijferman met het empathisch vermogen van een rekenmachine de schoonheid van een taal niet, de statistische aanname bij het oversteken van de rivier in plaats van een real-time peiling is als de voorspelling van verkiezingen op basis van een dubieuze status quo. Het is dan ook vooral de bedrijfsstatistiek van de MBA manager welke maatschappelijk steeds meer gaat wringen. Vraag wie die ‘deplorables’ zijn die zich identificeren met hun eigen realiteit ga je met de taalkundige beperking van gesloten vragen en de beperkte keuze in antwoorden van enquêtes niet oplossen. Niet in de laatste plaats door het privacy vraagstuk aangaande anonimiteit:
https://www.computable.nl/artikel/nieuws/datamanagement/4531184/250449/anonieme-gegevens-verraden-identiteit-nog-steeds.html
Wat betreft de methodologische en statistische blunders van datalekken is er een oude maar nog altijd relevante visie van WRR op de transistie naar een datagedreven overheid. Maatschappelijk verantwoord betekent dan ook vooral inzicht in de modellen die gebruikt worden en het recht op correctie van gegevens die er gebruikt worden. De check & balance die om de review van veranwoording gaat wordt in een crisis al snel terzijde geschoven met tunnelvorming aangaande de antwoorden tot gevolg. Dit geldt met name voor de regressie analyse van een gemiddelde want van de maan af gezien zijn we allen even groot volgens Eduard Douwes Dekker.
Hamer & sikkel van CBS is als het zwart-wit van de tekeningen in Jip & Janneke verhalen als het om binaire realiteit van cijfers gaat terwijl niet alles op die manier meetbaar te maken is. Het Excel management middels een Monte Carlo variatieanalyse kent daarom ook de waarschuwing dat resultaten uit het verleden geen garantie voor de toekomst geven maar dat vertelt cijfermans niet. En wat betreft het poetsen van data en statistische blunders hobbelen we daarom van crisis naar crisis.
Ewout, sinds wanneer is een datalek een statistische blunder? Het is vrijwel altijd een kwestie van een slecht systeemontwerp of slecht systeembeheer of slordig gebruik van systemen, of een combinatie hiervan. Het gaat om menselijke fouten van IT-ers of systeemgebruikers. Soms gaat het om een hack en ook dan kan de verantwoordelijkheid deels liggen bij een niet oplettende beheerder of een slordige gebruiker en soms bij een programmeur die een lek in het systeem heeft gecreëerd.
He, is empatisch vermogen ineens een streven geworden ?
Lamme leidt de blinde als de autist leidt de cijferman.
Of de schrijver leidt de statisticus ?
Die statisticus gaat natuurlijk niet verdrinken in een rivier waarvan die de gemiddelde diepte weet, daarom is die ook statisticus geworden.
Schrijvers en en verkopers zijn weer goed in andere zaken.
Of zoals die dubieuze airplane manufacturer meldde: ons vliegtuig crasht niet meer keren fataal dan de zo betrouwbaar geachte Boeing of Airbus. Namelijk precies 1 maal.
Nee Jacobus, statistiek is de kunst van het verkrijgen van kennis uit statistische data of gegevens waarbij vaak koppelingen gebruikt worden om verbanden te onderzoeken. En een datalek wordt gedefinieerd als het opzettelijk of onopzettelijk vrijgeven van bijvoorbeeld persoonsinformatie wat dus relatief eenvoudig is met de sleutel van persoonlijk identificeerbare informatie in open data. Cijfermatig staat de overheid met stip op één als het om datalekken gaat en bij elkaar opgeteld is het idee van een nationale data-steward begrijpelijk maar volgens WRR rapport nr 86: iOverheid zit crux in het feit dat het lastig blijkt om opdrachtgeverschap en verankerende beginselen voor privacy met elkaar in verbinding te brengen. In gewoon Nederlands, ieder kijkt alleen naar zijn eigen loket waardoor het niet de menselijke fouten van IT-ers zijn als het om een privacy-by-design systeemontwerp gaat maar een bestuurlijke onwil.
Oja, het ordenen van de maatschappij in getallen met een datacatalogus is een andere statistiek dan exploratieve data analyse met negatieve effecten zoals bias en hoge variaties. De kunst van informatieverwerking is dan ook meer dan wiskunde als het om het verbinden van de puntjes gaat om het plaatje compleet te maken en dan heb ik het nog niet eens over het kleuren ervan.
Ewout, je reactie was dus ongelukkig geformuleerd, alleen je wilt het nog niet toegeven. Goed, dat is jouw probleem.
Bovendien, als een ICT-er willens en wetens meewerkt aan de uitvoering van politiek bestuurlijke onwil (of onkunde) om privacy-by-design, enz. te negeren, dan ben je als ICT-er nog net zo goed medeschuldig. Voor ons geldt geen befehl ist befehl.
Dank Jacobus alleen is jouw probleem dus de ontkenning dat je al enige tijd langs de zijlijn staat want je onderneming kende al enige tijd geen activiteiten meer waardoor deze enige jaren geleden ambtshalve is doorgehaald. Of ben je als ZZP-er tegenwoordig zo onafhankelijk dat je gewoon je inkomsten niet opgeeft?
Ach Ewout Dekkinga, je weet hoe het een botterik vergaat.
Ik citeer vrij uit het handboek soldaat.
Als een botterik je in de zeik wil nemen.
Dan neemt men niet snel de benen.
Men gaat gedecideerd enkele stappen opzij.
De urine van botterik komt dan publiekelijk vrij.
De botterik staat in z’n eigen zeik.
Men verlaat diens geurbereik
De botterik voelt na een tijdje nattigheid.
En begrijpt eindelijk zijn bezigheid.
Ik ben dus weg.
En iedereen weet waar jij staat, met dunne pech. (;-|