Slinger Jansen-Roijackers (Universiteit Utrecht) breekt lans voor vaak vergeten groep research software engineers
Te vaak blijft het werk van de makers van onderzoekssoftware onderbelicht, meent Slinger Jansen-Roijackers, universitair hoofddocent aan Universiteit Utrecht. Terwijl ze eigenlijk een pluim verdienen. Zorgen zijn er ook, met name over het gebrek aan documentatie en het onderhoud van de software.
Deekshitha M neemt deel aan het online interview. Zij is een PhD-student aan het eScience Center in Amsterdam en promoveert bij Slinger Jansen-Roijackers. Deekshitha heeft onderzoek gedaan naar de impact van research-software en dit toegelicht in april 2024 op de Nationale Research Software Dag in Hilversum.
Zij komt met de definitie van onderzoekssoftware, geleend van Fair4RS: ‘alle broncodebestanden, algoritmen, scripts, computationele workflows en uitvoerbare bestanden die zijn gemaakt tijdens het onderzoeksproces of voor een onderzoeksdoel.’
Verborgen
Jansen-Roijackers licht toe: ‘Het gaat om software die is gemaakt om een bepaald onderzoek te kunnen doen, bijvoorbeeld het voorspellen van de temperatuur in de oceanen, het opstellen en verfijnen van klimaatmodellen, of het waarnemen van botsingen van deeltjes in de krachtigste deeltjesversneller ter wereld, die van Cern.’ En, benadrukt hij, ‘natuurlijk worden er bij studies ook commerciële producten als Excel, PowerPoint van Microsoft gebruikt, of software van SPSS, maar dat valt niet onder de definitie van onderzoekssoftware. Het gaat echt om programmatuur die geschreven is om bijvoorbeeld bepaalde analyses te doen ten behoeve van een academisch project.’
Hoewel deze onderzoekers software schrijven, zijn zij geen programmeurs, maar research software engineers, zoals dit artikel het verschil beschrijft.
Verborgen werk
Juist daar zit een angel: het schrijven van de software geldt niet als zelfstandig studieobject. Jansen-Roijackers: ‘Academici zijn veel tijd kwijt aan het schrijven van voorstellen om geld binnen te halen voor onderzoek. Dan gaat het om het doel: bijvoorbeeld het leggen van relaties tussen klimaatverandering en conflicten, duurzame energieopslag met geavanceerde materialen of klimaatrobuuste landschappen. In de aanvraag voor geldelijke ondersteuning gaat het om de onderzoeksvraag en -methode; nooit over de specifieke software die nodig is om tot resultaten te komen. Daarmee is het werk van ‘research software engineers verborgen.’
De programmatuur is een instrument om onderzoeksdoelen te bereiken. Een instrument dat de onderzoekers zelf (laten) bouwen; werk dat maar heel zelden in de onderzoeksaanvraag staat.
Off the shelf
Aan de universitair hoofddocent de vraag hoe dat schrijven van die specifieke software dan gewoonlijk gaat? ‘Iemand begint enthousiast iets in Python te schrijven. Stelt het voor in de opensource-gemeenschap, er vormt zich een groep die aanvullingen of aanpassingen maakt en uiteindelijk is het voor iedereen beschikbaar. En heb je dus off-the-shelf- software. Dat is anders wanneer je de programmatuur bijvoorbeeld door Capgemini laat maken; dan is het niet gemaakt voor algemeen gebruik, maar voor één specifieke gebruikerscasus.’
Er zit een risico aan de manier waarop onderzoekssoftware gewoonlijk ontstaat. ‘Het ontbreekt bijvoorbeeld te vaak aan documentatie. Als de onderzoeker onverhoopt onder de bus komt, is de intellectuele bagage die bij de software hoort, verloren. Ook ontbreekt het meestal aan een helpdesk. De software is ‘open’ en kan dus door iedereen worden toegepast, maar bij vragen kunnen ze nergens terecht. Ik ken een professor die klaagt dat hij als vraagbaak dient terwijl hij wel wat anders heeft te doen. Een plan voor verdere ontwikkeling van de software is te vaak niet aanwezig. Hetzelfde geldt voor update-programma’s.’
– Slinger Jansen-Roijackers (Universiteit Utrecht)Het volwassenheidsmodel helpt de makers van onderzoekssoftware verder
Alle software gaat Jansen aan het hart, dus heeft hij een volwassenheidsmodel ontwikkeld voor research-software. ‘Ik niet alleen, trouwens. We werken nauw samen met het Netherlands eScience Center en de Universiteit van Leiden. Dan heb ik het specifiek over Deekshitha van Universiteit Utrecht, Rena Bakhshi, Jason Maassen en Carlos Martinez Ortiz van het eScience Center, en Rob van Nieuwpoort van de Universiteit Leiden.’
Hij is trots op het volwassenheidsmodel. ‘Dit helpt de makers van onderzoekssoftware verder. Zij hoeven ook niet alles zelf te doen; zij kunnen bijvoorbeeld een beroep doen op het eScience Center om aan de criteria voor volwassen software te voldoen. Met aandacht voor de levenscyclus van de programmatuur. Het kan best zijn dat de software niet meer nodig is als bijvoorbeeld na vijf jaar een academisch project klaar is, dan moet je de onderzoekssoftware netjes afronden.’
Belangen
Deekshita (et al) heeft in haar onderzoek de verschillende belangen in kaart gebracht. Vier groepen spelen een rol: de ontwikkelaars (software-ingenieurs zelf), de financiers, de beleidsmakers en de onderzoekers. Voor de research software engineers geldt vooral dat zij erkenning verdienen voor hun werk. En dus genoemd willen worden in de onderzoeksartikelen als medeauteur. Voor onderzoekers is het van belang dat hun werk zoveel mogelijk (wereldwijd) wordt geciteerd. Voor beide groepen geldt dat zij het op prijs stellen als gelijken (peers) hun werk (goed) beoordelen.
Beleidsmakers en financiers spelen verschillende, maar onderling verbonden rollen binnen bestuur en financiering. Met name in de sectoren onderzoek, onderwijs en overheidsbeleid. ‘Beleidsmakers zijn verantwoordelijk voor het formuleren en implementeren van regels en richtlijnen die de strategische richting en operationele kaders van instellingen en organisaties vormgeven. Denk dan aan beveiligingsbeleid of regels voor bescherming van intellectueel eigendom.’
De financiers vinden het belangrijk dat wordt aangetoond dat zij waar voor hun geld krijgen. En dat de software en het project zijn afgestemd op internationale, strategische doelen, zoals Open Science. ‘Het selecteren van projecten met een significante impact verbetert het imago van de financiers en toont hun betrokkenheid bij het ondersteunen van waardevol en innovatief onderzoek’, licht Jansen toe.
Ook Google
Wie zijn dan zoal geldschieter? Durfkapitalisten kom je in dit speelveld niet tegen. Er valt, aldus Jansen, simpelweg weinig te verdienen met onderzoekssoftware. In Nederland gaat het om de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO). Jaarlijks investeert NWO bijna één miljard euro in nieuwsgierigheid gedreven onderzoek, gericht op maatschappelijke uitdagingen en in onderzoeksinfrastructuur. Voorts doet het eScience Center een duit in het zakje. En verder is er een aantal organisaties als de Stichting Internet Domeinregistratie Nederland (SIDN), KNMI en Beeld en Geluid.
En vergeet de grote bedrijven zoals Google niet, voegt de universitair hoofddocent toe. ‘Dit bedrijf investeert onder andere veel in onderzoekssoftware ten bate van kunstmatige intelligentie.’ Slinger Jansen-Roijackers doel? ‘Dat de research software engineers de erkenning krijgen die ze verdienen. Voorts dat zij op een volwassen manier hun werk doen. En dat het aantal van de huidige honderd engineers die bij het eScience Center werken, groeit naar duizend!’