Dat een klein deel van de exponentieel groeiende en snel verouderende data veelvuldig wordt gebruikt, zou elke organisatie ertoe aan moeten zetten om na te denken over een effectieve archiveringsstrategie. Dit is belangrijk voor het kostenefficiënt bewaren en beheren van gegevens op de lange termijn.
Of het nu gaat om een actief archief met directe toegang tot gegevens of een langetermijnarchief voor zogenaamde ‘koude bestanden’, it-teams hebben de taak om constant te zoeken naar effectieve en voordelige opslagopties. In deze bijdrage vergelijk ik drie veelgebruikte archiveringsopties met elkaar.
- On-premises object storage
On-premises object storage, oftewel ‘objectopslag op locatie’, is tegenwoordig een populaire optie voor het opslaan en beschermen van gegevens binnen een datacenter omdat het onder het eigen it-beveiligings- en gegevensbeheerbeleid valt. Meestal kopen bedrijven een kant-en-klaar apparaat voor objectopslag van bekende opslagleveranciers of bouwen ze een aanpasbaar en schaalbaar objectopslagcluster dat is geconfigureerd met softwaregedefinieerde opslaitg met S3/htttp-toegang. Dit biedt hen een architectuur met ontzettend veel veerkracht en stabiliteit.
- Public cloud storage
Het opslaan van data in de publieke cloud (vaak gebaseerd op S3-objectopslag) is aantrekkelijk wanneer u de voorkeur geeft aan een externe provider om de opslaginfrastructuur te huisvesten en te beheren. U hoeft zich geen zorgen te maken over it-activiteiten en het op- en afschalen van capaciteit wanneer dat nodig is. Hostingproviders bieden verschillende sla’s voor stabiliteit en beschikbaarheid om aan verschillende behoeften te voldoen. Hoewel een all-cloud-benadering nog steeds niet mainstream is, is de acceptatie van hybride cloud bezig met een inhaalslag waarbij gegevensopslag wordt gedistribueerd tussen on-premises/private cloud- en public cloudlocaties op basis van zakelijke behoeften.
- Lto tape
Linear tape-open (lto) wordt gebruikt voor gegevensopslag op lange termijn, met name wanneer offline (air gapped) opslag een vereiste is. Tapedrives worden gebruikt om gegevens op te slaan die in de nabije toekomst niet hoeven te worden geraadpleegd. De tapes met daarop de data worden meestal veilig opgeborgen op externe locaties en bieden zo een extra manier om gegevens te beschermen. Het gaat hier natuurlijk niet om realtime-informatie, maar wanneer er op regelmatige basis backups worden gedraaid, dan biedt het een solide basis in het geval er een recovery moet plaatsvinden.
Opties voor archiefopslag vergelijken
Elk van deze opslagopties past goed bij een bepaald gebruiksscenario. Er kan natuurlijk ook gebruik gemaakt worden van een combinatie van technologieën. Laten we ze vanuit verschillende aspecten vergelijken.
|
On-premises object storage |
Public cloud storage |
Lto tape |
Locatie |
On-premises datacenter, secundaire/dr-locaties, externe vestigingen |
Offsite – gehost in de public cloud |
On-premises data center, offsite |
Voetafdruk voor van gegevensopslag voor organisaties |
Afhankelijk van de opslagcapaciteit en het toegepaste gegevensbeschermingsbeleid |
Nihil – aangezien alle gegevens worden opgeslagen in de public cloud |
Afhankelijk van de opslagcapaciteit en het toegepaste gegevensbeschermingsbeleid |
Kosten |
Initiële capex voor de appliance/hardware indien nodig, en daarna eenvoudige en voorspelbare opex voor dataservices en beheer (eventueel met softwaregedefinieerde opslag) |
Geen infrastructuurkosten op locatie. Maar onvoorspelbare kosten, zoals kosten voor uitgaand data verkeer, die jaarlijks oplopen, kosten voor het ophalen van gearchiveerde gegevens, wan-kosten, indirecte kosten in verband met gegevensmigratie naar de cloud. |
Initiële capex-kosten voor hardware voor tapedrives. Lage bedrijfskosten voor onderhoud en vervanging van cartridges. |
Datasecurity |
Pas intern beveiligingsbeleid, encryptie, authenticatie, enz. toe. Gedetailleerde controle (op objectniveau) van beveiliging en compliance om aan de vereisten te voldoen. |
Beheerd door hostingprovider; geen flexibiliteit om organisatorische beveiligingsvoorschriften toe te passen |
Past intern beveiligingsbeleid, encryptie, authenticatie, enz. toe. Een gedetailleerde beleidsdefinitie is moeilijk op tapeniveau. Als het beleid eenmaal is ingesteld, is het moeilijk om de initiële configuratie later te wijzigen. |
Dataprotectie |
Flexibel gegevensbeschermingsbeleid volgens vereiste. Sla overtollige kopieën on-premises op of kopieer naar een secundaire site/cloud. Extra zelfherstellende mogelijkheden beschermen tegen bitrot en datacorruptie. |
Volledig vertrouwen op de serviceprovider voor het handhaven van hoge duurzaamheidsniveaus op basis van sla |
Er kunnen meerdere back-up-kopieën worden opgeslagen op tape-apparaten op verschillende locaties voor herstel |
Datatoegang |
On-demand always-on active archive: het meest geschikt voor samenwerkings-workflows, gedistribueerde toegang en content delivery. |
Langere toegangsvertragingen en incidenteel verlies van service (afhankelijk van de kwaliteit van de internetverbinding) |
Trage laadtijden en sequentiële toegang: niet geschikt om gegevens op te slaan die directe toegang vereisen |
Doorzoekbaarheid |
Metadata-gestuurd contentbeheer vereenvoudigt het zoeken naar bestanden |
Metadata-gestuurd contentbeheer vereenvoudigt het zoeken naar bestanden |
Zoeken is alleen mogelijk via opslagapplicaties zoals media asset managers. |
Downtime Recovery |
Snel herstel met erasure coding segmenten en replica’s |
Afhankelijkheid van sla’s van cloudserviceproviders om het probleem op te lossen en gegevens te herstellen |
Bij frequente toegang is er een hoger risico op slijtage. Herstel is complex. |
Storage beheerinspanning |
Er is zeer minimale inspanning nodig voor beheer, vooral wanneer softwaregedefinieerde opslag wordt gebruikt |
Nihil – omdat het allemaal wordt geregeld door de serviceprovider en extra kosten met zich meebrengt |
Beheer is niet zo eenvoudig. Handmatige inspanning is vereist bij het vervangen van cartridges, het verplaatsen van tapemedia tussen locaties, enz. |
Hardware refresh |
Nodes hebben doorgaans een vernieuwingscyclus van vijf jaar. Met softwaregedefinieerde opslag is het eenvoudig om gegevens ter plaatse te migreren en hardware zonder onderbrekingen te vernieuwen. |
Volledig beheerd door de serviceprovider. |
Aanzienlijke handmatige tussenkomst is nodig wanneer het wisselen van media en loopwerken oud worden en moeten worden geüpgraded. Ook het migreren van data tussen verschillende generaties lto is niet eenvoudig. |
Toegang tot single & bulk files |
Geschikt voor beide |
Beter voor één bestand of een kleiner aantal bestanden vanwege de kosten van uitgaand data verkeer. |
Beter voor het ophalen van bulk (bijv. productieset), omdat zodra media zijn geladen, de streamsnelheden snel zijn |
Zoals uit de tabel blijkt, zijn er duidelijke voordelen en beperkingen van elke benadering. Uiteindelijk bepalen uw vereisten de juiste opslagoptie. En vaak is het niet altijd het een óf het ander. Voor bedrijven die hun gegevens intern willen beveiligen en beschermen, zou een oplossing voor objectopslag op locatie de juiste keuze zijn. Voor andere organisaties zou een combinatie hiervan, waarbij objectopslag op locatie het actieve archief is, ideaal zijn.
Laten we een voorbeeld bekijken waarin u een combinatie van deze opties kunt gebruiken. U kunt een betaalbaar objectopslagplatform op locatie gebruiken om zelden gebruikte gegevens van primaire nas-/bestandsservers te verplaatsen. Dit zou uw belangrijkste actieve archief zijn.
- Inactieve gegevens, grote mediabestanden, backups, enz. kunnen eenvoudig gemigreerd worden naar dit schaalbare on-premises objectopslagplatform waar u snel toegang toe heeft wanneer dat nodig is.
- Deze gegevens zijn vervolgens voor meerdere jaren veilig op basis van het beveiligingsbeleid van uw organisatie en de regels die gelden om gegevens lokaal op te slaan.
- Vervolgens kunnen deze gegevens worden verplaatst naar een deep archive in de public cloud of naar tape voor opslag op langere termijn.
Het is aan te raden om meerdere kopieën van gegevens te maken (voor redundantie) op dezelfde on-premises locatie of op een secundaire site. Omdat u de flexibiliteit hebt om de opslagmedia te kiezen, kunt u uw primaire back-up op een interne harde schijf of een fysieke server hebben en een secundaire kopie op verwisselbare media zoals tape. De optie bestaat ook om off site Data Recovery in de cloud te hebben (tools voor cloud-tiering zijn hier handig).
Meest geschikt
Wat de meest geschikte manier om uw gegevens op te slaan en te beschermen is hangt dus echt af van uw specifieke situatie. Praat erover met experts die alle ins en outs kennen van de verschillende opties en op basis van gesprekken, analyses en benchmarks kunnen adviseren welke oplossing(en) u het beste kunt inzetten om uw data toegankelijk, veilig en toekomstvast te houden.
Een effectieve archiveringsstrategie begint bij het classificeren van data want opmerkelijk veel data mag na aanmaken niet meer gewijzigd worden. Waarom we deze data niet direct naar een ‘Write Once, Read Many’ schrijven is mij een raadsel want er is procesmatig veel te verbeteren in het Informatie Lifecycle Management (ILM) van ‘dossiergericht’ werken. Dit geldt zeker in bepaalde niches (zoals zorg en media) als we kijken naar ongestructureerde data die we moeten bewaren. Doorzoekbaarheid hiervan wordt bepaalt door het opslagmedium maar de indexering en een slimme scheiding van de data en metadata maakt de keus voor de opslag irrelevant:
https://datastorage-na.fujifilm.com/object-archive/
Tape is niet dood, tape is groen want data-in-ruste op een tape in een library vraagt 0 Watt aan stroom. Nieuwe protocollen voor toegang zorgen ervoor dat tape steeds vaker opgenomen wordt in de storage tiering waarbij koude data dus niet meer op de disks staat maar op tape terwijl de diskcache steeds vaker flash is. Aangezien Caringo is overgenomen door DataCore is de koppeling naar tape interessant maar het is niet de enige speler in de markt voor Active Archiving.