Oude wijn in nieuwe zakken? De term groen geeft aan dat het efficiënter is en daarom beter voor het milieu. Gaat het hier dan om maatschappelijk verantwoord ondernemen of om ‘ordinaire’ kostenbesparing onder de noemer van? Mogelijk beide, in ieder geval dient het beide.
Hand in hand met innovatie
Eén ding staat als een paal boven water, ‘greening of storage' gaat hand in hand met innovatie van ‘storage'. Waarbij we ‘storage' kunnen onderverdelen in drie categorieën: informatie, data en opslag.
Wanneer we spreken over ‘greening of storage', dan hebben we het eigenlijk hoofdzakelijk over de categorieën data en opslag. De categorie informatie zegt meer over de waarde van de data die eronder ligt en daar zit hem dan ook meteen het probleem. Het merendeel van de organisaties is nog niet in staat daadwerkelijk informatiemanagement toe te passen in de organisatie, zeker niet waar het gaat om ongestructureerde data (files, content, etc.) en semi-gestructureerde data (mail).
Bij informatiemanagement gaat het hoofdzakelijk om organisatorische processen waarin bepaald wordt wie wat wanneer mag of moet. Daarbij komt naast de economische waarde ook nog eens wet- en regelgeving om de hoek kijken die maakt dat er vanuit de verschillende disciplines binnen een organisatie anders naar gekeken kan worden.
Het invoeren en doorvoeren van informatiemanagement vergt diepgaand ingrijpen in de processen en werkwijzen binnen organisaties en is mede daarom een kostbare en vaak verstorende aangelegenheid, die dan ook snel gemeden zal worden. Al helemaal wanneer de alternatieven goedkoper en minder verstorend zijn.
Welnu, deze alternatieven zijn te vinden in de twee andere categorieën, data en opslag.
Goedkoper en goedkoper
De fysieke opslag (hierbij wordt, refererend aan disken, SAN, NAS, etc., de term storage gebruikt) is de laatste jaren goedkoper en goedkoper geworden. Een trend die zich ook in de toekomst zal voortzetten. Opmerking daarbij: de explosieve groei van data heft genoemd prijsvoordeel snel op. Daarbij komt dat beheer, migratie, beveiliging en datamanagement een groot deel (om niet te zeggen het grootste deel) van de kostenfactor bepaalt.
Waarom in deze categorie dan toch ‘greening of storage'? Heel simpel: omdat de resources efficiënter moeten kunnen worden ingezet. De fysieke disk kan goedkoper worden, maar als deze maar voor maximaal 30 procent wordt benut en er bovendien voor alle omliggende processen fysieke kopieën gemaakt dienen te worden, dan verdwijnt het prijsvoordeel razendsnel als sneeuw voor de zon.
Daarbij zijn ook de energiekosten (stroom en koeling, vaak in combinatie met de beschikbare ruimte) inmiddels een zwaarwegende factor. Een aspect dat zeker ook een rol speelt, is de beveiliging in de vorm van back-up, restore, business continuity en disaster recovery. Deze drukken immers ook een zware stempel op de storagekeuze en daarmee op de kosten. Bovendien gaat het uitgangspunt dat SLA's (service level agreements) bepalend zijn voor de technologiekeuze maar al te vaak niet op vanwege de vaak zeer traditionele inzet van storage. De uiteindelijke totale kosten van storage, of beter gezegd datamanagement, worden bepaald door de beheerbaarheid van de infrastructuur en niet de extra korting op de aanschaf, de grotere organisatie zijn daar inmiddels achter. Beheerskosten kunnen alleen naar beneden als de technologie daar de mogelijk toe biedt.
Innovatie het antwoord
Het antwoord op dat alles: innovatie. Innovatie in overvloed binnen de storagemarkt. Zeker in vergelijking met de servermarkt ( inclusief het operating system ). In de storagemarkt is dan ook de winst te behalen. Vooropgesteld dat qua innovaties het kaf van het koren wordt gescheiden en de innovaties ook daadwerkelijk toepasbaar zijn.
Overigens: innovaties in de storagemarkt hebben geen betrekking op de hardware. Deze evolueert vanzelf en zorgt er aldus voor dat alles sneller, groter en goedkoper wordt. Met de kanttekening daarbij dat, hoewel de software de functionaliteit bepaalt, ook deze evolutie (met name waar het de diskmarkt betreft) zijn grenzen kent. Om een paar voorbeelden van innovaties op een rijtje te zetten:
– Virtualisatie van storage, oftewel het delen van resources gaat verder dan alleen consolideren.
– Thin-provisioning is het efficiënter inzetten van deze resources waarbij de utilisatie van de disks van 30 procent naar bijvoorbeeld 70 procent gaat.
– Snapshots die het mogelijk maken om binnen luttele secondes volledige back-ups (consistentiepunten) te maken zonder impact of overhead, waardoor onbelemmerd 24×7 productie kan worden afgedwongen met zelfs een hogere beschikbaarheid en beveiliging.
– Cloning waarbij gebruik wordt gemaakt van snapshots en datasets zonder kopieerslag beschikbaar kunnen worden gemaakt aan andere processen; zelfs door middel van een ander (goedkoper) protocol (FC vs. iSCSI ); denk hierbij bijvoorbeeld aan OTA-omgevingen (ontwikkel, test en acceptatie).
– De-duplicatie waarbij datablokken in de achtergrond, dus transparant voor gebruikers en applicaties (die dit daadwerkelijk als informatie zien ) worden ontdubbeld. Deze technologie heeft zich inmiddels in de back-up naar disk-wereld bewezen en ziet nu (zij het met beperkingen) de toepassingen in de primaire opslagwereld. Er bestaan twee soorten: de-duplicatie in-band en out-of-band, waarbij de eerste natuurlijk het meest direct resultaat oplevert.
– Compressie wordt al tijden gebruikt in de opslag; toch zijn ook hier ontwikkelingen te melden die een enorme toegevoegde waarde leveren, met name op primaire en secundaire opslaglagen; compressie als een appliance die in-band word geplaatst kan tot wel 50 procent filedata reduceren!
De uiteindelijk totaal haalbare winst is het resultaat van een optelsom van deze innovaties, in combinatie met de laatste categorie, die van de data.
Data-categorie: meeste effecten
De data-categorie is het terrein waar de meeste effecten te halen zijn. Natuurlijk is het mogelijk om met de innovaties op de opslag laagtheoretisch, afhankelijk van de omgeving, een reductie tot wel 80 procent aan fysieke storage te realiseren, maar dat vergt wel de nodige sturing.
Welnu, deze sturing ligt op het niveau van de datamanagementlaag. Uiteindelijk gaat het er immers om de data te kunnen classificeren en aan iedere klasse de juiste eigenschappen te hangen. Eigenschappen als bijvoorbeeld de karakteristieken van de storage, zoals performance, beschikbaarheid en functionaliteit, maar ook bijvoorbeeld de bewaartijden van de data in combinatie met eventuele wettelijke eisen bepalen natuurlijk de uiteindelijke kosten.
Groener kan het niet!
Ste je je eens voor dat dit alles toepasbaar is en dat het vervolgens mogelijk is om geautomatiseerd de geclassificeerde data transparant voor gebruikers en applicaties op de juiste storage te doen landen. Juist, dan is er daadwerkelijk sprake van sturing en controle. Wanneer het mogelijk is om de storage tiers te definiëren met toepassing van alle innovaties, dan is werkelijk sprake van kostenbesparing door efficiëntere omgang met resources. Groener kunnen we het niet maken, toch?!
Nou, misschien toch wel, zeker waneer we het 80/20-principe toepassen. Het luistert natuurlijk niet zo nauw, maar in het algemeen komen we (uitzonderingen daargelaten) aardig in de buurt.
Bij een gemiddelde organisatie is 80 procent van de data gerelateerd aan files (content, ook als deze geïndexeerd is ). Daarbij is 80 procent van deze files statisch. Dat betekent dat er winst te halen is door deze statische data (data die niet verandert) te scheiden van de dynamische data. Statische data hoeft immers niet continu te worden beveiligd en kan op veel goedkopere storage worden opgeslagen, al dan niet gededupliceerd en/of gecomprimeerd.
De file-virtualisatielaag
Om dit te realiseren, en wel transparant voor gebruikers en applicaties, vergt een extra laag: de file-virtulalisatielaag. File-virtualisatie, een trend die we de komende jaren meer en meer toegepast zullen zien, werkt als een appliance die in-band in het data pad staat en die gebruikmaakt van een global name space.
Wat er feitelijk gebeurt is het scheiden van de fysieke relatie of het pad van een gebruiker dan wel applicatie naar een file, waardoor ineens legio mogelijkheden ontstaan. We noemen: migratie, replicatie, DLM ( data lifecycle management), archivering, balancing zonder impact op de productie en transparant voor de gebruikers en applicaties. Voeg daarbij dat het mogelijk is om contentindexing toe te passen en een compleet nieuwe toepassing is een feit. Natuurlijk, out-of-band archiving bestaat al een tijd maar feit is dat daar toch wel de nodige nadelen aan kleven, zeker in geval van grote(re) omgevingen en wanneer technologie dient te worden uitgefaseerd en gemigreerd.
Ander woord voor innovatie
Goedbeschouwd is ‘greening of storage' een ander woord voor innovatie en het toepassen en inzetten ervan. Wie kritisch een dataomgeving, het gebruik van de resources en de toepasbaarheid van innovaties tegen het licht houdt, heeft al snel een haalbare business case.
Natuurlijk is er sprake van bestaande investeringen, maar met het juiste inzicht en de juiste visie is het zonder meer mogelijk om zowel korte als lange termijn strategieën ontwikkelen en de ideale omgeving te bouwen die direct al een enorme meerwaarde opleveren voor de organisatie.
Daar is niet meer en niet minder voor nodig dan de 80/20-regel toepassen en de eerste winsten dienen zich aan. Vervolgens is het zaak om via onderzoek inzicht te krijgen in het datalandschap. Zet innovatie in voor wat quick wins en bouw aan een visie voor korte en lange termijn.
Wie de categorie informatiemanagement goed onder knie krijgt, legt door middel van een goede en efficiënte infrastructuur de basis voor een gezonde informatieomgeving die niet alleen financieel gezond is maar bovendien een overduidelijke meerwaarde biedt aan de organisatie en zijn processen.
Greening of storage is een feit
Oude wijn in nieuwe zakken of niet, ‘greening of storage' is een feit. Bewezen innovaties toepassen met het juiste inzicht geeft een efficiëntere, kosteneffectievere en groenere data- en storage-omgeving.