Het Leuvense onderzoekscentrum Imec heeft software ontwikkeld die dna-stalen in minder dan zes uur kan analyseren in plaats van twee dagen. Een doorbraak in big-data-gebaseerde dna-analyses.
Dankzij de nieuwste versie van de software van Imec, met de naam ElPrep5, kunnen de gigabytes aan data uit dna-stalen nu in enkele uren tijd informatie opleveren over mogelijke genetische afwijkingen. Dat is volgens Imec acht tot zestien keer sneller dan met de meest gangbare software.
Bovendien is de analyse uit te voeren op een klassieke server, in bijvoorbeeld een ziekenhuis. De doorbraak opent mogelijkheden voor hospitalen om zelf dergelijke analyses te starten in plaats van ze uit te moeten besteden aan gespecialiseerde analyselabo’s.
‘Een dokter kan ’s avonds een analyseberekening beginnen en de volgende dag de resultaten bespreken met zijn patiënt’, aldus Imec-onderzoekster Charlotte Herzeel. Dankzij de snellere berekening dalen ook de kosten van de servers die een ziekenhuis eventueel huurt in de cloud.
Big-data-analyse
Dna-analyse bestaat ruwweg uit twee delen. Ten eerste het omzetten van een fysiek dna-staal in een digitale reeks ‘letters’ waaruit het dna is opgebouwd. Ten tweede het analyseren van die digitale dna-gegevens om bijvoorbeeld te kijken of er genetische afwijkingen in optreden.
In dit hele proces wordt de fysieke dna-streng in stukjes geknipt en vermenigvuldigd. Het digitaliseren ervan levert gigabites aan data op waaruit de oorspronkelijke streng dan weer moet opgebouwd worden om hem vervolgens te kunnen controleren op afwijkingen.
Het is een complex proces wat veel rekenkracht en big-data-analysemethodes vraagt. De ElPrep-software van Imec is, volgens het onderzoekscentrum, toonaangevend in het automatiseren van deze laatste complexe stappen.
Het snel en betaalbaar kunnen analyseren van genetische informatie is, zo benadrukt Imec, een van de essentiële vereisten van de toekomstige gezondheidszorg waar ziektepreventie, vroege diagnose en patiëntgerichte therapie centraal staan.
De kost van dna-analyses daalde de voorbije tien jaar al significant. Maar de doorlooptijd, tot 48 uur voor een volledig genoom, bleef een struikelblok. Die tijd herleiden tot minder dan zes uur is dan een hele stap voorwaarts.
De belangrijkste reden waarom Imec met de software dergelijke snelheden haalt, is doordat de software slechts eenmaal door alle data leest om vervolgens alle bewerkingen uit te voeren. Heel die tijd wordt zoveel mogelijk data in het geheugen gehouden.
Klanten
Imec hoopt de nieuwe software deze maand op de markt te brengen. De kostprijs is nog onbekend. Potentiële klanten zijn medische laboratoria, hospitalen, wetenschappelijk onderzoek en farmaceutische bedrijven. Verscheidene industriële partners zouden, volgens Imec, al interesse tonen om de software in gebruik te nemen.