Ook al dalen de prijzen van harde schijven, de overstap van tape naar schijf voor opslag is voor veel bedrijven niet vanzelfsprekend. Een vtl (virtual tape library) kan uitkomst bieden doordat die bestaande back-upsoftware wijs maakt dat back-ups nog steeds op tape worden gemaakt.
Volgens IDC daalde de gemiddelde prijs per GB van harde schijven tussen 2004 en 2006 van 55 naar 33 eurocent. Het onderzoeksbureau voorspelt dat die trend doorzet; in 2008 kost 1 GB 21 eurocent. Het ligt dus voor de hand om back-ups voortaan alleen nog op schijf te maken en die ouderwetse tapes de deur uit te doen. Het kost meer tijd om tapes te beschrijven en te lezen. Bovendien zijn ze minder lang houdbaar dan schijven.
Toch schrikken veel bedrijven nog terug voor de overstap naar opslag op schijf. Volgens een onderzoek onder honderd internationale bezoekers van de Gartner Storage Summit in juni dit jaar (zie pagina 25) slaat bijna 60 procent van de organisaties gegevens nog steeds alleen op tape op. Slechts 2 procent is volledig overgestapt op schijfopslag. 40 procent schrijft gegevens eerst weg naar schijf en vervolgens periodiek naar tape.
Risico
Bedrijven aarzelen om volledig over te stappen op d2d-opslag (disk-to-disk) omdat bestaande back-upprocedures vaak zijn ingesteld op de aanwezigheid van tape. Het is veel werk om die procedures aan te passen. Bovendien vormt elke wijziging in een back-upprocedure altijd een risico. Systeembeheerders zien daarom vaak op tegen de overstap naar back-up op schijf.
De industrie heeft daar een oplossing voor bedacht: ‘virtual tape library’. Een virtuele tapebibliotheek is een back-upserver die de bestaande back-upapplicaties wijs maakt dat hij een echte tapebibliotheek is, inclusief verschillende tapeapparaten en bijbehorende formaten. Informatie wordt op dezelfde manier weggeschreven als bij tape, maar dan veel sneller. Het systeem gedraagt zich als een tape met de snelheid van een schijf. Het voordeel van vtl is dat investeringen in archiveringbeleid en operationele back-upsoftware overeind blijven.
Het vtl-denken is niet nieuw. Bedrijven als IBM en StorageTek bieden al langer oplossingen. Met het aanbod van de huidige vtl-aanbieders, waaronder EMC, Sun, Hitachi, Quantum, Network Appliance, Overland en HP, is integratie in de moderne it-omgeving goed te realiseren.
De momenteel leverbare vtl-oplossingen gebruiken vooral ata- en sata-schijven. Een basisopstelling bestaat uit een vtl-server waarop speciale software draait, de mediaserver. Dit systeem vormt het hart van elke vtl-oplossing. Die software zorgt ervoor dat achteraf duidelijk is op welke tape (in feite op welk gedeelte van de vaste schijf) welke informatie is weggeschreven. De software bootst de traditionele tapeformaten en bijbehorende apparatuur na. Denk aan tapesoorten, het type en aantal drives en de gekozen tape-rotatiemethodiek. Vtl’s zijn via ip-netwerken te koppelen, bijvoorbeeld met het iscsi-protocol. Daardoor is kritische bedrijfsinformatie snel en accuraat te kopiëren.
Je kunt vtl-oplossingen naast een bestaande strategie voor tapeback-up inzetten. Ook is het mogelijk alle back-upactiviteiten met vtl op te lossen. Door inzet van speciale software blijven de vertrouwde tapeformaten, die voor sommige applicaties nodig zijn, beschikbaar.
Benaderingen
Als een organisatie een vtl-oplossing wil, kan men kiezen uit twee benaderingen: de vtl-opslagappliance of een oplossing op basis van een serverappliance, een apart computersysteem met de vtl-software.
Bij de vtl-opslagappliance zijn zowel de schijven als het systeem met de vtl-software in één behuizing ondergebracht. Dit kant-en-klare systeem bootst een fysiek tapearchief na. Het voordeel is dat slechts één systeem nodig is. Dat bespaart ruimte en er zijn geen ingewikkelde koppelingen tussen verschillende vtl-onderdelen. De appliance kan ook automatisch gegevens kopiëren naar fysieke tapes. Hierbij kan automatisch een kopie op schijf worden bewaard, zodat informatie snel van de back-up valt terug te halen. Verder is deze vtl-variant eenvoudig in te voeren omdat hij uit één systeem bestaat. Een nadeel is dat uitbreidingen soms lastig zijn door het beperkte aantal fysieke plaatsen voor schijven. Als systemen van verschillende leveranciers worden gecombineerd, kan het beheer problematisch zijn.
Bij een vtl-oplossing die is gebaseerd op een serverappliance, een apart computersysteem met de vtl-software, worden de aparte schijven via ‘fibre channel’ of een andere opslagtechniek gekoppeld. Zo spreid je het risico van uitval van hardware. Bij deze oplossing kan je een groter aantal schijven aansluiten dan bij een vtl-opslagappliance. Beide benaderingen zijn beschikbaar voor open, mainframe- en besturingssysteemspecifieke omgevingen.
Verder komt de ‘grid’- of netwerkgebaseerde architectuur voor. Ook deze gebruikt aparte schijven. Er zijn extra mogelijkheden voor het beheer van de set schijven die virtueel beschikbaar zijn via bijvoorbeeld een op ip gebaseerd san (storage area network).
Tot slot zijn er fabrikanten die ‘tapebibliotheekgebaseerde systemen’ leveren. Hierbij is het mogelijk om data weg te schrijven naar zowel schijven als tapes in een bestaande tapebibliotheek. Het voordeel is dat zowel tapes als schijven in één vtl-oplossing zijn geïntegreerd.
Compressie
Het grootste voordeel van vtl is dat data sneller te kopiëren zijn en dus ook sneller beschikbaar zijn bij een verzoek tot herstel. Daartegenover staan diverse problemen. Als de vtl-oplossing het formaat waarmee de back-ups worden gemaakt niet ondersteunt, ontstaat direct een probleem. Data is dan niet of slechts deels terug te zetten en dus niet volledig beschikbaar.
Daarnaast loopt de capaciteit van iedere vtl-oplossing, los van de gekozen architectuur, op een bepaald moment tegen een plafond aan. Fabrikanten proberen die beperking op te heffen via compressietechnieken. De plaats waar compressie wordt uitgevoerd verschilt. Het kan plaatsvinden door de back-upsoftware op het systeem zelf of via speciale compressiesoftware op de vtl. Compressiefactoren lopen sterk uiteen. Het gemiddelde ligt op 2:1. Compressie vereist wel veel rekenkracht binnen het vtl-systeem. Als die niet beschikbaar is, kan dat tot aanzienlijke vertragingen leiden. Fabrikanten proberen het probleem van de rekenkracht onder andere te omzeilen door data in het interne geheugen van de vtl te houden tot de compressie volledig is. Dat voorkomt continue lees- en wegschrijfacties naar de schijven tijdens het comprimeren.
De spectaculairste compressiemethode is ‘data de-duplicatie’. Dat kan een verhouding tussen fysiek bestand en verkleinde versie van 25:1 opleveren. De techniek is zo ontwikkeld dat data die op meerdere plaatsen voorkomt en in omvang en verschijnen identiek is slechts eenmaal wordt gekopieerd. Met behulp van speciale metadata worden de verschillende identieke blokken data bij het terugzetten van informatie uit elkaar gehaald en in de juiste volgorde geplaatst. Voor de-duplicatie is echter nog veel meer rekenkracht nodig.