Het Centraal Bureau voor de Statistiek (CBS) gaat nieuwe en aanvullende databronnen ontsluiten. De maatschappelijke vraag naar betrouwbare feitelijke informatie groeit namelijk snel, mede door de toenemende behoefte om datagedreven te gaan werken.
Volgens Irene Salemink, directeur Innovatie, Ontwikkeling en Beheer bij het CBS, gaan de ontwikkelingen op datagebied razendsnel. Ze wijst daarbij op nieuwe technologieën zoals sensoren en artificial intelligence. ‘We zijn een data gedreven maatschappij geworden; data zijn tegenwoordig overal. Dat heeft effect op de rol van nationale statistiekbureaus; de manier waarop zij data verzamelen verandert.’ Volgens Salemink komt dat ook omdat het CBS met de huidige manier van data verzamelen niet altijd meer kan voldoen aan de groeiende vraag naar actuele statistieken.
Corona
De pandemie heeft dit proces nog eens versneld, bijvoorbeeld op gebied van financiële transactiegegevens. Corona laat zien dat er een grote behoefte bestaat aan actuele informatie over maatschappelijke fenomenen. De pandemie werkt in dit opzicht als een katalysator voor de ontsluiting van bijvoorbeeld private databronnen.
Salemink: ‘Om de economische impact van de coronapandemie te kunnen meten, ontvangt het CBS nu van diverse organisaties gegevens over betalingen en financiële transacties. Die maken inzichtelijk in welke branches de bestedingen achteruitgaan en waar ze juist toenemen. Het CBS probeert hierdoor inzicht te krijgen in de financiële gevolgen voor verschillende bedrijfstakken, bijvoorbeeld de detailhandel en het reisverkeer. De financiële transactiegegevens komen nu op weekbasis bij het CBS binnen. Daardoor hebben we een goed beeld van de meest actuele ontwikkelingen. Beleidsmakers gebruiken die informatie bij hun afwegingen voor het maken van beleid.’
Datascouting
De zoektocht naar aanvullende en nieuwe databronnen wordt ook wel datascouting genoemd. Het gaat hier om data uit publieke en private bronnen, die een beter beeld geven van complexe fenomenen in de maatschappij. Bert Kroese, plaatsvervangend directeur-generaal van het CBS: ‘Het gaat het CBS niet om de data op zich, maar om de bijdrage aan de samenleving.’
Het CBS streeft er naar zo actueel en accuraat mogelijke cijfers te leveren. Kroese: ‘Dat is de reden waarom het CBS toegang wil tot dergelijke data. Hoe meer data we als statistiekbureau kunnen gebruiken, hoe groter de meerwaarde voor de samenleving. Alle uitkomsten stellen we ook als open data kosteloos beschikbaar via ons open data-portaal. En onder zeer strikte voorwaarden is ook toegang tot microdata mogelijk voor wetenschappelijk onderzoek. Zo wordt maximale meerwaarde gegenereerd uit de data. Maar wij moeten in alle gevallen wel heel duidelijk kunnen maken waarom we die specifieke data nodig hebben.’ Privacy staat bij datascouting voorop.
Lastig onderwerp
Verder gaat het CBS de waarde van data onderzoeken. Tot nog toe was die niet terug te vinden in de statistieken. CBS-onderzoeker Hugo de Bondt spreekt van een lastig onderwerp. Het hangen van een prijskaartje aan data is nog niet zo eenvoudig. Het CBS schat de waarde van data die bedrijven beheren op basis van de kosten die gemoeid zijn met het verkrijgen van die data. ‘Dat is een beproefde methode’, zegt De Bondt. ‘We brengen daartoe verschillende beroepen in kaart en stellen vast hoeveel werktijd mensen in deze beroepen besteden aan data. Vervolgens tellen we loonkosten, opslagkosten en een winstpercentage bij elkaar op om tot een waarde te komen.’
Het onderzoek laat zien dat de waarde van data in Nederland gemeten in jaarlijkse uitgaven tussen de 15,6 en 20 miljard euro bedraagt in 2017 en elk jaar toeneemt. Vooral de categorie data science groeit sterk. Het beheer van opslag van data vindt juist weinig plaats in Nederland, aldus De Bondt. ‘Dat wordt vaak uitbesteed, bijvoorbeeld naar organisaties in Azië.’ De overheid, waaronder het CBS zelf, en het onderwijs zijn bij het onderzoek naar de waarde van data buiten beschouwing gelaten. ‘We hebben deze sectoren niet meegenomen omdat zij geen ‘eigenaar’ zijn van de data.
Interessant artikel over Datascouting!