De jury van de vijfde editie van de Nederlandse Dataprijs heeft negen onderzoeken geselecteerd die kans maken op de Nederlandse Dataprijs. Er waren 47 inzendingen, de genomineerden maken kans op een prijs in één van de drie categorieën. Kanshebbers zijn onder meer OpenINTEL dat lange-termijn-onderzoek doet naar de ontwikkeling van DNS (Domain Name System). Ook PAN, een project om archeologische metaalvondsten te documenteren, is genomineerd
De wedstrijd wordt georganiseerd door DANS (Data Archiving and Networked Services). Dat is een instituut van KNAW (Koninklijke Nederlandse Akademie van Wetenschappen) en NWO (Nederlandse Organisatie voor Wetenschappelijk Onderzoek).
Onderzoekers hadden tot 1 juli 2018 om hun onderzoek of dat van een andere onderzoeker of onderzoeksgroep te nomineren. De prijs gaat naar de wetenschapper of onderzoeksgroep die volgens de jury een belangrijke bijdrage levert aan de wetenschap door onderzoeksdata beschikbaar te maken voor aanvullende of nieuwe analyses.
Dit jaar wordt de Dataprijs uitgereikt in drie categorieën: humaniora en sociale wetenschappen, exacte en technische wetenschappen en medische en levenswetenschappen. De winnaars ontvangen een beeld en vijfduizend euro om hun dataset toegankelijk(er) te maken. De prijsuitreiking vindt plaats op 28 november 2018 bij NWO in Den Haag.
Bekijk hieronder het overzicht van de genomineerden per categorie:
Categorie humaniora en sociale wetenschappen
ETCBC-database of the Hebrew Bible
De Biblia Hebraica Stuttgartensia Amstelodamensis (BHSA) is een dataset van het Eep Talstra Centre for Bible and Computer (ETCBC). De BHSA bevat de volledige tekst van de Hebreeuwse Bijbel (Oude Testament). Deze tekst is voorzien van zeer uitgebreide en met grote zorg vervaardigde taalkundige annotaties.
GDL Area database
De GDL Area Database is een online database waarin ontwikkelingsindicatoren op subnationaal niveau beschikbaar worden gesteld aan onderzoekers en beleidsmakers wereldwijd. Ze bevat momenteel honderdzestien indicatoren op sociaal-economisch, demografisch, onderwijs, arbeidsmarkt, gender en sociaal-medisch gebied voor meer dan twaalfhonderd regio’s in meer dan honderdtwintig landen en wordt voortdurend uitgebreid.
Portable Antiquities of the Netherlands (PAN)
Het project PAN is opgezet om de privécollecties van met name archeologische metaalvondsten te documenteren en online te presenteren, voor wetenschappelijk onderzoek, monumentenzorg en voor het brede publiek om kennis over erfgoed te vinden en beleven.
Categorie medische en levenswetenschappen
BBMRI-omics
BBMRI-omics is een data-infrastructuur met moleculaire omics-data van duizenden deelnemers aan negentwintig Nederlandse biobanken. BBMRI-omics is publiek beschikbaar en stelt wereldwijd onderzoekers in staat om nieuwe mechanismen en biomarkers van ziekte en gezondheid te ontdekken.
Blueprint
Bleuprint representeert een EU-gesubsidieerd project om data omtrent de verpakking van DNA (ook wel epigenetica genoemd) in alle types bloedcellen in kaart te brengen. Het gaat hierbij om bloedcellen van zowel gezonde personen als van mensen met verschillende bloedziektes zoals leukemie.
1000IBD
1000IBD bevat prospectief verzamelde fenotype data (waaronder voedingspatronen, medicatierespons en ziekteactiviteit), omgevingsfactoren en meerdere lagen omics-data van meer dan duizend Nederlandse patiënten met de Ziekte van Crohn en colitis ulcerosa (samen IBD). De dataset wordt continu verrijkt doordat nieuwe patiënten worden geïncludeerd en er van patiënten steeds nieuwe gegevens worden verzameld: door artsen in het elektronisch patiëntendossier en door patiënten in een app.
Categorie exacte en technische wetenschappen
HANZE (Historical Analysis of Natural Hazards in Europe)
HANZE bestaat uit twee databases. Een daarvan is een gerasterde dataset van blootstelling aan natuurlijke gevaren voor 37 Europese landen en gebieden van 1870 tot 2020, met hoogresolutie-informatie over landgebruik, bevolking, bruto binnenlands product en rijkdom. De tweede dataset bevat informatie over data, locaties en verliezen ten gevolge van 1564 schadelijke overstromingen in Europa (1870-2016). HANZE maakt het mogelijk informatie over verliezen als gevolg van natuurlijke gevaren te ‘normaliseren’ door rekening te houden met demografische en economische groei en prijsinflatie.
AgroDataCube
De AgroDataCube is een datadienst waarin open data van verschillende bronnen worden samengebracht en vindbaar worden gemaakt. Hierbij kan gedacht worden aan perceelsdata (RVO) en remote sensing data uit satellietportalen. De data worden duurzaam beheerd bij de bron, en op servers van de Universiteit Wageningen.
OpenINTEL Active DNS Measurements
Het OpenINTEL project registreert langdurig dagelijks de toestand van het internet Domain Name System (DNS). DNS verzorgt de cruciale vertaling van voor mensen leesbare namen in voor machines leesbare informatie. Door de toestand van DNS te registreren kunnen langetermijnontwikkelingen op het internet worden gevolgd en de veiligheid van internet worden verbeterd. Op dit moment verzamelt OpenINTEL data voor 207 miljoen domeinnamen wereldwijd.