Met de rijke dataset van het Nederlandse Centraal Bureau voor de Statistiek (CBS) in de hand heeft Guus Berkelmans, onderzoeker bij het Centrum Wiskunde & Informatica, in samenwerking met Stichting 113 Zelfmoordpreventie een methode ontwikkeld om beter de signalen te begrijpen dat iemand gevoelig is voor zelfdoding. Hij promoveert op deze studie op 24 oktober aan de VU Amsterdam.
‘Turing and Van Gogh walk into a bar’, luidt de naam van Berkelmans’ thesis. Met de ondertitel ‘A computational approach to suicide research’. Hoe is hij op deze naam gekomen? In de inleiding legt hij uit dat de titel van dit proefschrift voortkwam uit een eenvoudige vraag: welke concepten of personen drukken het beste de verbinding uit tussen de computationele kant van deze scriptie en de kant van het zelfmoordonderzoek? Het antwoord leidde tot de twee personen in de titel: Alan Turing en Vincent van Gogh. Turing was de wiskundige die de Enigma kraakte door een van de allereerste computers te bouwen. Hij wordt algemeen beschouwd als de meest invloedrijke figuur in de computerwereld. Hij overleed in 1954 door zelfmoord op de jonge leeftijd van 42 jaar. Vincent van Gogh was een zeer invloedrijke schilder, maar niet tijdens zijn leven. Ook hij overleed door zelfmoord, in 1890 op de nog jongere leeftijd van 37.
De connectie tussen de kunstschilder en computers ligt niet meteen voor de hand. Toch is die er. De stijl van Van Gogh is zo specifiek en hij heeft zo veel geschilderd dat je met kunstmatige intelligentie elk onderwerp kunt laten ‘schilderen’ in de stijl van Van Gogh. Op deze manier is ook de beeltenis op de uitnodiging voor de promotie tot stand gekomen.
Subgroepen
Meer dan 700.000 zelfmoordoden per jaar wereldwijd. Het is daarom, zo schrijft Berkelmans, ontzettend belangrijk om effectieve preventie-interventies te implementeren. ‘Voor de meeste van deze interventies is het echter cruciaal om te weten op welke subgroepen in de populatie we ons moeten richten. Het eerste deel van dit proefschrift richt zich volledig op dit probleem en benadert het door de lens van big data. Met gegevens van het CBS beginnen we te kijken naar demografische gegevens, en of we groepen met een hoog risico kunnen identificeren aan de hand van hun demografische kenmerken.’
‘We vinden veel van deze groepen, zoals mannen, mensen van middelbare leeftijd, mensen met een uitkering en alleenstaanden’, vervolgt de onderzoeker. ‘Daarna kijken we of er kruispunten zijn van deze groepen die een hoger risico lopen dan je zou verwachten als deze risicofactoren onafhankelijk van elkaar zouden werken. Ook hier vinden we meerdere onverwachte groepen zoals mannelijke weduwnaars en mensen met een laag opleidingsniveau tussen 25 en veertig jaar. We keken vervolgens naar medicijngebruik en ontdekten dat een groot aantal medicijnklassen geassocieerd werden met een verhoogd risico op suïcide.’
In het tweede deel van het proefschrift richt Berkelmans zich op de theoretische vragen die ontstonden met betrekking tot het eerste deel: hoe beslis je welke kenmerken je opneemt, is het mogelijk om de afhankelijkheid tussen waarnemingsvariabelen te kwantificeren?
Loftrompet
Berkelmans steekt in zijn drukwerk (242 pagina’s) de loftrompet af over het CBS. In Nederland hebben verschillende instellingen databases met informatie over de Nederlandse bevolking, zoals gemeenten, belastingdienst, het ministerie van onderwijs en de zorgverzekeraars. De meeste zijn wettelijk verplicht informatie te verstrekken aan het CBS.
Dit resulteert in een grote database met informatie over leeftijd, geslacht, huidige verblijfplaats, opleidingsstatus, werkstatus, inkomen, sociale uitkeringen, burgerlijke staat, huishoudelijke status, zorgkosten en voorgeschreven medicijnen. Bovendien, en cruciaal, zijn forensisch pathologen verplicht om doodsoorzaken direct aan het CBS door te geven. ‘Deze schat aan onaangeroerde kennis biedt velen een kans voor grootschalig, robuust en onbevooroordeeld onderzoek.’
Je kunt er antwoord vinden op de vraag: wie sterft er door zelfdoding’? Maar het is niet eenvoudig om er de juiste inzichten uit de destilleren. Hulpverleners ontbreekt het meestal aan voldoende computer- en statistische kennis om dat te doen. En datawetenschappers, computerdeskundigen of wiskundigen ontbreekt het aan de praktische ervaring en kennis die nodig is om praktisch te kunnen handelen naar de gevonden resultaten.
Hij geeft aan dat, omdat hij CBS-gegevens heeft gebruikt, zijn bevindingen alleen voor Nederland opgeld doen. Tegelijk meldt hij dat de door hem ontwikkelde methode universeel is. Dus ook bruikbaar voor andere landen met andere gegevens. ‘Omdat andere landen andere soorten gegevens hebben, kan het interessant om te zien welke inzichten uit hun databases kunnen worden verkregen en of die de onze zouden kunnen aanvullen.’
Combinaties
Het is Berkelmans gelukt de risicogroepen in kaart te brengen, hetgeen met conventionele methodes niet mogelijk bleek. Bovendien heeft hij een manier ontwikkeld om combinaties van variabelen een score te geven. De gangbare methodes geven geen waarde aan de interacties tussen de risicofactoren. Daardoor lukt het hem groepen te definiëren met een hoog risico, maar ook groepen die anders niet zouden zijn gevonden.
Voor artsen is zijn onderzoek relevant omdat het verbanden blootlegt tussen medicijnen en suïcide. Berkelmans vindt het – in vervolg op zijn eigen onderzoek – interessant om na te gaan tot welke onthullingen andere interdisciplinaire benaderingen komen. ‘Een interessante manier om te verkennen zou bijvoorbeeld zijn om te kijken naar het biologische aspect van zelfmoordpreventie. Zoals we lieten zien (….) zijn er verbanden te vinden tussen medicijnen en zelfmoord. De mate waarin deze associaties causaal zijn moeten nog worden onderzocht. Bovendien kan het interessant zijn om mogelijke (neuro)biologische mechanismen te onderzoeken die ten grondslag liggen aan de associaties, om de bijdragende biologische routes tot suïcidaal gedrag beter te begrijpen.’
De promotie is op 24 oktober van 11:45 t/m 13:15 uur online te volgen.