Het Erasmus Medische Centrum in Rotterdam gaat Oracle's Exadata inzetten voor het opslaan en analyseren van dna-variatiegegevens. Ict-dienstverlener VX Company levert en onderhoudt de grote dataopslagomgeving via een private cloud. Het universitair medisch centrum zegt daarmee de benodigde opslagruimte voor de enorme hoeveelheden data aanzienlijk te kunnen beperken. Verder worden de query-responstijden van twaalf minuten met Exadata terug gebracht naar enkele seconden.
In de nabije toekomst bestaat de kans dat ziekenhuizen dna-data beschikbaar moeten houden zolang de patiënt in leven is. Dna-sequencing-technologie wordt vooral ingezet in erfelijkheidsonderzoek en kankerdiagnostiek. Daarnaast is het toepasbaar in microbiologie en het domein van de virologie. Een gemiddeld dna-onderzoek resulteert in 1,5 TB aan ruwe data per persoon. Bij kankeronderzoek wordt dna van een tumor met dna van normaal weefsel, afkomstig van dezelfde patiënt, met elkaar vergeleken. Er is dus al sprake van 3 TB aan ruwe data. Dit betekent dat bio-informatica-afdelingen te maken krijgen met enorme hoeveelheden data die moeten worden opgeslagen en geïnterpreteerd, aldus het Rotterdamse ziekenhuis.
Red Hat en Tibco
Oracle heeft samen met dienstverlener VX Company en het bio-informaticateam van Erasmus MC een speciaal datamodel ontwikkeld dat op de Oracle''s Exadata-storageplatform draait. Herman Slange, technisch manager Oracle bij VX Company, vertelt: ‘De dataopslagoplossingen staan in verbinding via een netwerk van Surfnet met het rekencentrum Sara in Amsterdam, waar de data worden verwerkt en geanalyseerd. Dit moet zo worden gedaan, omdat er te weinig capaciteit is in het rekencentrum van Erasmus MC in Rotterdam. VX Company beheert dit allemaal op afstand via een private cloud. De beheerserver is gebaseerd op Red Hat en bij dataverwerking wordt software van Tibco gebruikt.'
Full rack-machine
Momenteel onderzoeken de wetenschappers de mogelijkheden de compressie te optimaliseren. Daarmee is het mogelijk om meer patiëntengegevens op te slaan en worden de query-responstijden versneld voor de genoom-variatieanalyse. Exadata is daarvoor een goede schaalbaale oplossing, aldus Herman Slange.
Om eenvoudig te kunnen opschalen als de behoefte aan storage en processing-kracht toeneemt naar mate er meer 'patiënten-genomen' gesequenced zijn, maakt Oracle gebruik van een ‘legoblokprincipe'. Het kleinste model is een kwart rack-machine, dat kan worden uitgebreid tot een halve of uiteindelijk een volledige rack-machine. De configuratie is zelfs uit te bouwen tot een cluster van acht full rack-machines.
Dna-sequencing
Het dna van een mens telt ongeveer 30.000 genen, zegt Professor Peter van der Spek van Erasmus MC: ‘Die kunnen door middel van een zogenaamde sequencing-techniek helemaal in kaart worden gebracht. Geprint betekent dat een sliert papier van 250 kilometer lang. Die 30.000 genen liggen verscholen in drie miljard bouwstenen. Hierin zoekt een bio-informaticus naar ‘typefouten' en kan de dokter afleiden of er sprake is van een mutatie (een ziekmakende verandering in het dna). Dna-onderzoek is tegenwoordig in sterke mate afhankelijk van ict. In Rotterdam werken we met de vermaarde derde generatie dna-sequencing-technologie, waardoor we wereldwijd met onze database een voorbeeld zijn voor andere medische centra. Oracle Exadata vormt hierin een belangrijke schakel.'