Storage uit de cloud is heel eenvoudig te doen en zorgt ervoor dat we makkelijker kunnen archiveren. Het is daarom een prima vervanger van back-up. Dit zei Rob Hilterman van Hitachi Data Systems tijdens de een paneldiscussie over cloudstorage tijdens de Infosecurity 2013.
In totaal vier Computable-experts discussieerden over het thema ‘Cloudstorage en de rol van het datacenter’. Aan tafel zaten Eric van Gend (Brocade), Alexander Grendel (Interoute), Rob Hilterman (Hitachi Data Systems) en Jeroen van Yperen (i3 Groep).
https://www.youtube.com/watch?v=8HYU0CgpN1Q
Computable kennissessie ‘Cloudstorage en de rol van het datacenter’
Pieter,
Helemaals mee eens. Dit is natuurlijk wat ik in het begin van deze discussie al direct geroepen heb.
‘Cloud Storage’ is een nogal breed begrip. Wij proberen zoveel mogelijk opties mogelijk te maken en uiteraard heeft het feit dat er storage over een netwerk getransporteerd moet worden gevolgen voor latency, heeft security implicaties en bandbreedte beperkingen. Dit betekent niet dat het geen goed idee is om cloud storage in te zetten. Zowel backup als archivering maar ook filesserver (al dan niet met WAN optimalisatie), verschillende IOP tiers en automatische replicatie tussen datacenters etc ligt binnen de mogelijkheden om als dienst in te kopen. Als je een beveiligde omgeving kan waarborgen met SLA’s die passen bij de data compliance en je als bedrijf weet aan welke performance eisen de storage moet voldoen zijn er tal van scenario’s te bedenken waar een cloud storage oplossing een kost efficiente mogelijkheid is. Maar het is zeker niet in alle gevallen in te zetten zoals terecht wordt opgemerkt.
“Archiveren met cloudstorage vervangt back-up”, is één van de sufste opmerkingen die we van een door Computable opgevoerde “expert” hebben kunnen vernemen. Wat je wel kan zeggen is dat als je goed archiveert, je meestal minder hoeft te back-uppen (zoals Ruud al meldt). Maar het is geen vervanging. Helaas heeft Rob Hilterman dit nog niet willen corrigeren.
De back-up heeft een heel ander doel dan de archivering, zoals Pieter aangeeft. De back-up (eigenlijk de restore daarvan, zoals Ewout schrijft) is voor het herstel van een situatie om na een calamiteit weer verder kunnen werken. Archiveren is voor het bewaren van gegevens in verband met bedrijfdoeleinden en de wettelijke eisen. Wat niet meer bewaart hoeft te worden kan en moet verwijderd worden. Anders is het archief niet meer dan een verouderde en onnodig moeizaam toegankelijke back-up. Wil je gearchiveerde gegevens snel kunnen benaderen, dan moet je near online of eventueel near-line-on-site opslag gebruiken.
Back-up/restore wordt meestal door de ICT afdeling uitgevoerd, terwijl archiveren door de gebruikersorganisatie zelf gedaan wordt. Je kan daarvoor soms dezelfde technieken gebruiken, maar de selectie van data en metadata is anders. Voor beiden kan men de cloud in de een of andere vorm gebruiken, maar dat hoeft niet. Het hangt onder andere af van welke eisen je aan de vertrouwelijkheid stelt.
Het is heel jammer dat men de twee functies, back-up/restore en archivering, niet uit elkaar heeft gehouden. Ik zou nooit met een bedrijf willen samenwerken die dit essentiële verschil niet onderkent.
In de hele discussie mis ik eigenlijk nog 1 belangrijke toevoeging: als er echt een grote calamiteit is geweest, denk aan een brand in de computerruimte, ernstige waterschade, etc, waarbij de internettoegang is ontregeld, dan is het niet vanzelfsprekend dat je snel bij je cloud back-ups kunt, laat staan dat je ze dan snel kunt restoren.
Ik denk dan ook dat de traditionele back-up uiteindelijk niet wordt vervangen/verdrongen door cloud backup, maar door ‘metroclouds’, waarin als 1 deel van een cluster uitvalt, alle applicaties op een ander deel van het cluster gewoon door kunnen blijven gaan omdat de toegang tot de data niet wordt verstoord.
Backup kan dan als achterliggend proces worden gehanteerd om in het geval van een rampscenario, waarbij ook de tweede node uitvalt, de data the kunnen herstellen, maar dan zal de verantwoordelijke IT-architect in zijn ontwerp wel moet beschrijven wat de vereiste hersteltijd is, en die tijd bepaalt dan of een cloud-backup, dan wel een locale back-up het meest efficiente/economische medium is. De keuze voor je data management landschap moet het gevolg zijn van de eisen die je stelt aan dataprotectie- en beschikbaarheid, en niet andersom.
(Voor de goede orde, ik werk voor NetApp en heb dus zeker een gekleurde mening vanwege het feit dat wij een MetroCluster-oplossing hebben. Maar die oplossing is niet voor niets zo populair bij cloudleveranciers, moeten we dan maar denken 🙂 )
Richard heeft helemaal gelijk. Je zou juist weer backups moeten maken van het Archief. Het archief kan je dan up to date houden, vervolgens geregeld laten backuppen. Backups kan je het beste zien als kopie van zoveel mogelijk data op een bepaald moment. Je kan in het geval van bijvoorbeeld een hack, je backup gebruiken om de situatie te herstellen naar hoe de situatie op een bepaald punt voor de hack was. Vervolgens kan je security measures toepassen.