Het beheer van de opslag van data over de hele onderneming vergt meer dan snelle opslagsystemen. Jan Wagenaar pleit voor een nieuwe architectuur waarin de processen van beveiliging en beheer worden gescheiden. Met de juiste software is dan een gecentraliseerd beheer te realiseren met gedistribueerde opslag-werkzaamheden.
Geavanceerde raid-systemen van IBM of EMC zullen voorzien in de behoefte aan een snellere toegankelijkheid van steeds meer data. Dat is mooi voor ‘datawarehousing’ en ‘datamining’. Maar het beheer van de opslag van data door de hele onderneming vergt meer dan dat. Volgens een voorzichtige schatting is 90 procent van alle hersteloperaties (restores) het gevolg van gebruikersfouten, zoals het per ongeluk op de delete-toets drukken of ‘nee’ in plaats van ‘ja’ aanklikken bij de vraag of een document bewaard moet worden. Op hardware-gerichte oplossingen als raid geven daartegen geen bescherming. De beste remedie is een regelmatige back-up. Echter, als gevolg van de steeds grotere verspreiding van bedrijfskritische data over de diverse file-servers en werkplekken en door de exponentiële groei van data wordt het verzorgen van een betrouwbare back-up niet alleen belangrijker, maar ook moeilijker. Als de basiseis van bescherming eenmaal adequaat is ingevuld, zijn aanvullende maatregelen voor opslagbeheer te nemen die de inzet van de (opslag)hardware optimaliseren, zoals archivering en eventueel HSM (Hierarchical Storage Manager).
In een ideale IT-wereld heeft de beheerder van de data alle gegevens centraal opgeslagen. Wat dat betreft was de mainframe-tijd zo slecht nog niet. We leven echter in een open omgeving met diverse besturingssystemen, programma’s, servers en PC’s. De gegevensomvang op al die systemen groeit door het succes van client/server- en PC-applicaties enorm snel. Sneller dan het netwerk aan zou kunnen om de data centraal op te slaan, want het netwerk zal nooit zo snel groeien als de hoeveelheid data. Daarbij komt dat er afdelingen zijn die zelf het beheer van hun data ter hand hebben genomen. Dat betekent dat er gevaar dreigt voor zogenaamde ‘point-solutions’ op lokaal niveau. Weinig standaardisatie op dat niveau verhoogt de kosten in een angstaanjagend tempo. Daardoor is er behoefte aan centraal management, onafhankelijk van de plek waar de gegevens zich bevinden: een nieuwe architectuur met een echt schaalbare oplossing voor een bedrijfsbrede aanpak van databeheer.
Software als sleutel
De ontwikkeling in de markt voor data-beheer zal gevoed worden door de hardware; de hardware-markt groeit naar 60 miljard dollar in 2000, de software-markt is dan ‘slechts’ goed voor 2 miljard dollar. De software zal echter bepalen hoe deze hardware wordt ingezet. Software vormt dan ook de sleutel tot een bedrijfsbrede aanpak van opslagbeheer.
Hoe kan zo’n architectuur een oneindig schaalbare oplossing bieden zonder concessies te doen aan beheersbaarheid, prestatie of beschikbaarheid? Dat is eenvoudig, namelijk door het feitelijke beveiligingsproces te scheiden van het beheerproces. Om dit te verduidelijken hanteren we de begrippen ‘data-zone’ en ‘control-zone’. De data-zone is het totale gebied dat wordt bediend door een opslagserver in een netwerk. Binnen zo’n zone is men dus niet afhankelijk van een groter netwerk voor de dagelijkse back-ups en ‘restores’. De meta-data (deze beschrijft de opgeslagen data) bevindt zich dan ook altijd binnen de data-zone. Hierdoor krijgt men snel de benodigde prestatie en betrouwbaarheid. Een ‘control-zone’ is een verzameling van data-zones om een aantal gecentraliseerde beheerfuncties te kunnen uitvoeren zoals monitoring, rapportage en ‘policy management’. De hoeveelheid data-zones hangt helemaal af van de grootte of de wensen van een organisatie. In feite kan men oneindig data-zones toe- of samenvoegen. Om deze architectuur mogelijk te maken heeft Legato onlangs zelf beheer-software op de markt gebracht, Global Enterprise Management of Storage. Gems, dat is gebaseerd op Java, biedt het benodigde gereedschap om centraal meerdere data-zones effectief te beheren. Het bevat een op beleid gebaseerd beheer, software-distributie, flexibele software-licensering en het beheer van tape-media met of zonder een tape-robot of gedeeld met meerdere applicaties.
Aantal data-zones onbeperkt
Door het scheiden van de processen van beveiliging en beheer wordt echte schaalbaarheid geboden. Binnen een data-zone zal de prestatie en de betrouwbaarheid recht-evenredig zijn met de aanschaf van de (snellere) hardware, aangezien de software daar geen flessehals zal vormen. Eventueel kan hier en daar een ‘storage node’ worden opgenomen om het lokale netwerk te ontlasten.
Het totale aantal data-zones is onbeperkt, omdat Gems de control- zone (Internet/) uitsluitend belast met een minimale hoeveelheid op Java-gebaseerde beheer-informatie. Op deze wijze is een betrouwbare opslag van data te krijgen in een data-zone, eventueel ook in een multi-platform omgeving. Men blijft namelijk één oplossing houden voor diverse data-zones met verschillende platformen. Hierdoor vermijdt men zogenaamde ‘point-solutions’ en de kosten die daaraan gerelateerd zijn: Tegenover iedere gulden die een willekeurig bedrijf uitgeeft aan hard- en software voor opslag, staan zes gulden beheerkosten!
Alleen deze nieuwe architectuur zal de tand des tijds doorstaan. Met de juiste software is een gecentraliseerd beheer te realiseren met gedistribueerde opslag-werkzaamheden. Natuurlijk zijn binnen een data-zone grote hoeveelheden data centraal op te slaan met raid- systemen en wat al niet meer. Maar een onbelemmerde groei van data over meerdere data-zones -bedrijfsbreed- is pas mogelijk als de architectuur dat toelaat. Die architectuur is nu beschikbaar.
Jan Wagenaar, manager Legato Systems Benelux te Amsterdam