Storage is voor de meeste organisaties van essentieel belang voor de ictinfrastructuur. Storage wordt veelal als prijzig ervaren en daarnaast zijn migratietrajecten lastig. Wat voor een soort storage hebben we in de toekomst nodig om dit te tackelen?
Storage is voor de meeste organisaties van essentieel belang voor de ict-infrastructuur. Veel grote organisaties hebben storage in hun eigen data center geplaatst en gebruiken deze voor het aanbieden van bedrijfskritische processen, zoals bijvoorbeeld email. Voor een dergelijke storage wordt meestal een storage area networks (san) ingezet. De gekozen san-oplossing is vaak een slecht schaalbare en nogal prijzige storage omgeving.
Aan de andere kant zien we steeds vaker dat storage als dienst uit een cloud wordt afgenomen. Toepassingsgebied voor dergelijke cloud storage zit met name in de hoek van backup, document sharing en remote opslag. Cloud storage is in vergelijking met san-storage bijzonder goedkoop, met name in beheer, maar is qua performance niet geschikt voor alle toepassingen. Dit komt bijvoorbeeld doordat bepaalde applicaties verwachten dat de storage lokaal en snel beschikbaar is. Dit is een probleem als de applicatie gescheiden is van de storage in de cloud.
Storage clouds zijn ontworpen om met name bestanden of objecten in op te slaan. Echter er bestaan verschillende type bestanden en die zijn niet allemaal geschikt om in de cloud op te slaan. Zogenaamde block-based storage clouds, simpelgezegd wordt hier ruwe storage aangeboden, worden nauwelijks aangeboden en het gebruik hiervan is alleen zinvol als de afstand tot een dergelijke cloud kort is, anders is er geen performance.
Problematiek
Een voorbeeld van de problematiek: Een bedrijf dat virtualisatie gebruikt, zoals VMware/Xen/KVM, heeft storage nodig voor de gevirtualiseerde systemen. Dergelijke virtualisatie technieken werken het beste als er block-based storage wordt aangeboden. Daarnaast is met name de snelheid, de roundtrip delay, waarmee deze storage bereikbaar is, cruciaal voor de performance van de virtuele machine. Dit komt doordat als een applicatie in de virtuele machine wil lezen van de disk er per enkele lees-actie meerdere keren interactie is tussen de disk en de virtuele machine. Als de disk gescheiden is van de virtuele machine en deze disk feitelijk honderden kilometers verderop staat, dan is de performance slecht. Vandaar dat Amazon alleen binnen de eigen cloud block-based storage biedt aan de virtuele machines, want dan is de storage snel bereikbaar.
Voor welk type toepassingen zijn object-gebaseerde storage clouds uitermate geschikt?
• Opslag van grote bestanden die vooral veel gelezen worden, zoals digitale content, video, muziek, streams.
• Tegelijkertijd wegschrijven van grote hoeveelheden video files, zoals bij camera beveiliging,
• Backup en archiveren van data
• Geografisch beschikbaar stellen van data.
Bestaat er een manier om enerzijds gebruik te maken van de voordelen van cloud storage en anderzijds dit te combineren met de meer traditionele manieren van opslag zoals san en nas? Inmiddels zijn er vele leveranciers die in hun traditionele san-omgeving intelligentie hebben toegevoegd waarmee bepaald kan worden op welke manier bepaalde data het beste kan worden opgeslagen. Als de data vereist dat er snelle toegang noodzakelijk is, dan wordt die op solid state disks geplaatst. Zijn deze eisen er niet, dan kan de data op relatief goedkope sata-disks worden geplaatst die qua kosten en performance vergelijkbaar zijn met cloud storage.
Naast deze twee voorbeelden kan de data ook nog in ram-geheugen, snelle sas-disks en bijvoorbeeld op tape worden geplaatst en is het mogelijk om de data dynamisch te laten migreren tussen de verschillende typen opslag. Deze laatste manier van data opslag heet tiered storage. Een voorbeeld van dynamische migratie kan zijn als een bepaald bestand populair is, dat het ineens vaak wordt opgevraagd, en hierdoor verplaatst wordt van de relatief trage sata=disks naar een solid state disk.
Tiered storage
Het is handig dat san-vendors tiered storage functionaliteit aanbieden, want bij de meeste bedrijven kan het overgrote merendeel van de data op de relatief goedkope sata-disk worden geplaatst binnen de san-omgeving. Het grote nadeel is dat san-leveranciers tiered storage alleen binnen hun eigen product aanbieden en ondersteunen. Als klant ben je dan nog steeds met handen en voeten gebonden aan deze leverancier en uitwijk naar een derde partij voor storage is bijzonder lastig.
Hoe zou het beter kunnen? Wat moet er ontwikkeld worden? In een data center moet er altijd snelle betrouwbare lokale storage zijn om bijvoorbeeld de virtuele machines disks te kunnen geven of bijvoorbeeld een lokale database op te kunnen draaien. Echter het volume van dit type storage is ten aanzien van de totale benodigde storage zeer beperkt. Als deze lokale storage-omgeving een nieuw type tiered storage zou ondersteunen, waarmee geautomatiseerd een groot deel van de data kan worden doorgestuurd naar een externe cloud storage-omgevingen dan is er én voldoende storage én wordt de lokale storage efficiënt gebruikt.
In tegenstelling tot enkele commerciële producten, die vergelijkbare functionaliteit in een black box aanbieden, moet de tiering via open protocollen geschieden, zodat er geen vendor lockin ontstaat. Op deze manier wordt tiered storage op een open manier geïmplementeerd en wordt het mogelijk om bij verschillende leveranciers storage af te nemen. Door de open protocollen worden storage migratietrajecten (het switchen van storage aanbieder) aanzienlijk vereenvoudigd en dat is in de toekomst belangrijk vanwege de stijgende data volumes. Kortom, een meer open storage omgeving heeft veel voordelen! Vraag als klant dan ook hiernaar, zodat dit meer aandacht krijgt bij de leveranciers.