Het zijn gouden tijden voor leveranciers van opslagsystemen. De komende vijf tot tien jaar blijft de hoeveelheid opgeslagen gegevens bij bedrijven jaarlijks verdubbelen. Maar de explosieve groei heeft ook zijn schaduwzijden voor gebruikers. Niet alleen stijgen de opslagkosten. Het is vooral de vraag hoe je al die terabytes onder controle houdt.
Sex and storage’. Om zijn lezers te prikkelen zette een columnist van het weekblad Computerworld deze kop een paar jaar geleden boven zijn artikel. Nu zou hij het woord seks niet boven zijn stuk hoeven te zetten om de aandacht te trekken. Opslag is in korte tijd veranderd in een verplicht nummer. Op dit moment geven ondernemingen al ongeveer de helft van hun IT-budget aan opslag uit. Diverse bureaus voorspellen dat dit aandeel in 2003 zal zijn opgelopen naar ongeveer 75 procent. Hoe kon opslag zo snel, zo belangrijk worden?
De explosieve groei van opslag is toe te schrijven aan het samenvallen van enkele ontwikkelingen. Zo leidde het sneller worden van ‘clients’ ertoe dat eindgebruikers de computer steeds zwaardere taken gaven. De tweede ontwikkeling ligt op het vlak van netwerken. Was een paar jaar geleden een overdrachtssnelheid van 10 of 16 Mbps nog gebruikelijk, nu is die snelheid een factor 10 tot 100 hoger. Hierdoor kunnen gebruikers met steeds grotere bestanden werken, en dat doen ze ook. Verder leidt de opkomst van toepassingen voor elektronische handel, erp-systemen en datapakhuizen tot een data-explosie. E-mail is ook een grote stimulans voor opslag, vooral omdat deze post meer en meer vergezeld gaat van geluidsclips en bewegende beelden.
San en Nas
De grootste doorbraak in opslag van de afgelopen jaren is het concept van Storage Area Networks. Simpel gezegd is dit een netwerk dat een extra laag vormt die data moet scheiden van de verwerkingseenheden. Het SAN-concept is niet nieuw. Al in 1991 kwam IBM met Escon, een ‘point-to-point’ geschakeld glasvezelnetwerk, dat harde schijven, tapes en printers met MVS-hosts verbond. In de jaren daarna voegde IBM er ‘gateways’ aan toe voor Unix-servers en voor Windows NT. Hiermee was een san van de eerste generatie een feit.
Inmiddels is er de SNIA, de Storage Networking Industry Association, die dit opslagnetwerk als volgt definieert: ‘Snelle en slechts voor één taak bedoelde netwerken die bestaan uit direct aangesloten opslagelementen, die zijn ontworpen om grote hoeveelheden data te verplaatsen tussen host-onafhankelijke, gedistribueerde opslagapparatuur’.
Een ‘san’ biedt grote voordelen. In de eerste plaats is er de grotere bandbreedte van bijvoorbeeld glasvezel die leidt tot een betere prestatie. De centrale opslag zorgt voor meer mogelijkheden, onder andere voor backup en herstel. De beheersbaarheid wordt groter en de beschikbaarheid verbetert aanzienlijk. Diverse fabrikanten leveren systemen die ‘remote-copy’ mogelijk maken, zodat data synchroon op twee verschillende plekken kan worden opgeslagen. De afstand tussen de locaties hangt af van het gebruikte medium en het protocol, met glasvezel is 10 kilometer mogelijk.
Het zusje van san heet NAS (Network Attached Storage). Deze opslageenheden zijn rechtstreeks op het lokale netwerk aangesloten. Aanvankelijk werden nas en san als concurrerende technieken beschouwd, maar in de praktijk blijken ze elkaar aan te vullen. Zo heeft EMC de Celerra Nas-fileservers geschikt gemaakt voor aansluiting op zijn san-systemen.
Hoewel het san-concept inmiddels geaccepteerd is door de industrie, zal het nog zeker een paar jaar duren voor alle leveranciers van opslagsystemen hun producten geschikt hebben gemaakt voor dit opslagnetwerk. Vincent Franceschini, manager ‘storage’-oplossingen van HDS en tevens bestuurslid van de Fibre Channel Association voor Europa, bevestigt dit. "In Europa zijn wel een kleine duizend san’s ingevoerd, maar 90 procent daarvan bevat alleen maar een paar switches en verdienen niet het predikaat san. Naar schatting zijn er in Europa 30 tot 50 echte san’s in productie."
Franceschini stelt dat veel bedrijven in een overgangsfase zitten naar een ‘storage area network’. Hij verklaart dat door te stellen dat het implementeren van een san voor de totale onderneming ten minste twee jaar in beslag neemt."
Doorbraken
EMC komt de eer toe de wereld van opslag een ander gezicht te hebben gegeven. Decennia was IBM absolute marktleider in de wereld van harde schijven en tape-opslag. Het behaalde winstmarges van 70 procent op zijn opslagsystemen.
Tot het eind van de jaren zeventig was opslag een saaie boel. Een bedrijf kocht een computersysteem van een bepaalde leverancier die ook het bijbehorende opslagsysteem erbij leverde. Het is de huidige marktleider EMC die de knuppel in het hoenderhok gooide. Eind jaren tachtig kwam EMC met een revolutionair idee; Raid (redundant array intelligent devices). Dit principe is gebaseerd op het parallel schakelen van goedkope schijfeenheden. Door gebruik te maken van de Raid-technologie kon EMC fors onder de prijs van IBM gaan zitten. Dankzij opvallende marketing slaagde EMC er in tien jaar tijd in marktleider te worden. Daarna zorgde EMC voor belangrijke andere doorbraken op het gebied van software voor ‘storage-management’. Zo introduceerde het als eerste software voor datareplicatie over grote afstand. Dankzij deze producten ging het bedrijf dit jaar voor het eerst IBM/Tivoli voorbij en is het nu ook marktleider in software voor opslagbeheer. In het boek ‘Radical marketing’, uitgegeven door Harper Business, wordt smaakvol uit de doeken gedaan hoe EMC erin slaagde IBM te verslaan.
Met modder gooien
De leveranciers van opslagsystemen IBM, EMC, HDS, Compaq, HP, Sun en Storagetek concurreren meedogenloos in de opslagmarkt. Vooral EMC en IBM (de nummers 1 en 2) schromen niet om elkaar zelfs met rechtszaken te lijf te gaan. Het afgelopen voorjaar bracht EMC de nieuwste Symmetrix op de markt, een opslagsysteem met een capaciteit van 19 terabyte. Kort daarna kwam IBM met zijn nieuwe systeem dat de codenaam Shark (haai) heeft. IBM stelt dat zijn systeem de helft kost van de Symmetrix. Mike Ruettgers, ceo van EMC, geeft dat onomwonden toe. Zijn verklaring is simpel. "De Shark is goedkoper, maar onze systemen hebben een technische voorsprong en daarom zijn ze terecht duurder."
In juni introduceerde Hitachi Data Systems (HDS) het opslagsysteem Lightning dat een maximale capaciteit heeft van 37 terabyte. Dit Japanse bedrijf tovert een aantal vergelijkingen uit de hoed die moeten aantonen dat Lightning in alle opzichten zijn concurrenten ver achter zich laat. HDS levert zijn systemen ook via oem-contracten met HP en Sun.
Sun introduceerde in juni een nieuw systeem van eigen makelij met een maximale capaciteit van 44 terabyte. Dat is opmerkelijk, want tot voor kort verkocht het bedrijf deze systemen via een oem-overeenkomst met opslagleveracier Storagetek. Sun op zijn beurt claimt dat het nieuwe systeem aanzienlijk sneller en goedkoper is dan de Shark van IBM.
Compaq, dat zijn sterke positie in opslag te danken heeft aan de overname in januari 1999 van Digital, maakte in mei bekend dat opslagsystemen een strategisch product worden. Ceo Michael Capellas stelde bij de introductie van de Alpha GS-serie, codenaam Wildfire, dat hij het accent gaat leggen op betrouwbaarheid. "We moeten met deze systemen net zo ‘fault tolerant’ zijn als met de processors. Bovendien is een absolute voorwaarde dat de opslagsystemen explosieve groei kunnen ondersteunen."
Partnerruil
De wereld van leveranciers van opslagsystemen is er een van wisselende contacten. Bedrijven die op een bepaald gebied concurreren, werken op een ander vlak weer samen. Maar het gaat bijna altijd om een soort verstandshuwelijk met meer dan één partner. Zo maakte HP vorig jaar een eind aan zijn oem-contract met EMC en ging het een contract aan met HDS. EMC sloot vorig jaar een samenwerkingsovereenkomst met systeemintegrator Comparex. Laatstgenoemde maakte daarop een eind aan zijn jarenlange affaire met HDS. Het Japanse bedrijf besloot daarop in Europa eigen vestigingen op te zetten. In Nederland werd een van die vestigingen een paar maanden geleden een feit. Pikant detail is dat deze vestiging wordt gerund door oud-medewerkers van Comparex, die ontevreden waren over de overname door EMC.
Een wel heel merkwaardige verhouding hebben IBM en EMC. IBM was er vroeg bij. Deze pionier introduceerde in 1956 de harde schijf die een opslagcapaciteit had van vijf megabyte. In het jaar van de introductie bracht het bedrijf de opslagsystemen onder in een aparte bedrijfsunit, de IBM Storage Systems Division.
Aan deze divisie gaf EMC vorig jaar een order van drie miljard dollar voor het leveren van hoge-capaciteitsschijven (10.000 omwentelingen per minuut) voor zijn opslagsystemen Symmetrix en Clariion. Omdat IBM niet in staat bleek deze systemen te leveren, zegde EMC de order af en gaf hem aan Seagate.
De introducties van de afgelopen maanden en het constant proberen elkaar af te troeven tonen in ieder geval aan dat de leveranciers flink denken te profiteren van de groei in opslag. Josh Krischer, directeur van de Duitse tak van de Gartner Group, heeft zijn bedenkingen over dit gekibbel. "Het gaat al lang niet meer alleen om de opslagcapaciteit en de snelheid. Vooral de functionele verschillen bepalen of een bedrijf uiteindelijk beter uit is met een systeem van leverancier x of y."
Krischer signaleert dat de configuraties van disks en diskssubsystemen de afgelopen jaren ingewikkelder zijn geworden. "Een vergelijking op prijs/prestatie is daardoor niet meer mogelijk, want je moet ook de functionele verschillen in de vergelijking betrekken. Pas dan kun je inzicht krijgen in de totale kosten."
Beschikbaarheid
De groei van de opslagmarkt leidde ook tot de opkomst van leveranciers die zich specialiseren in technieken die nauw verbonden zijn met opslag, zoals software voor backup en herstel.
Zo richt de Amerikaanse softwareleverancier Veritas zich met zijn producten op oplossingen voor de beschikbaarheid van data. Fred van den Bosch, het technisch geweten van dit bedrijf, was het afgelopen decennium verantwoordelijk voor de softwareontwikkeling. Hij noemt als belangrijkste trend de toepassingen voor Internet en het feit dat deze als eis stellen dat de data continu beschikbaar zijn. Van den Bosch: "Die ontwikkeling heeft als gevolg dat steeds meer ondernemingen ‘storage area networks’ gaan gebruiken. Alleen op die manier zijn ze in staat hun opslag te beheren."
Volgens een recent onderzoek van de Cahners Instat Group krijgt de markt van san en nas in het jaar 2004 een omvang van meer dan 10 miljard dollar. Dat betekent een gemiddelde groei van meer dan vijftig procent. Dit jaar passeert deze markt voor het eerst de grens van 2 miljard dollar.
Van den Bosch signaleert dat het topmanagement het belang van het beheer van opslag gaat inzien. "Tot voor kort lag de verantwoordelijkheid voor opslagsystemen te laag in de organisatie. In de VS is dit nu al vaak een taak op cio-niveau. Dat is terecht, want er geldt een vuistregel dat elke dollar die aan hardware wordt uitgeven drie dollar genereert aan opslag en beheerskosten."
Veritas heeft regelmatig overleg met een groep van ISP (Internet Service Providers) bedrijven over hun gezamenlijke problematiek. "Deze bedrijven kampen vooral met het probleem hoe ze hun infrastructuur zodanig moeten bouwen dat deze geschikt is om een explosieve groei makkelijk aan te kunnen."
Waar een slechte infrastructuur toe kan leiden, merkte Van den Bosch een paar maanden geleden. Hij werd toen te hulp geroepen door een beursgenoteerde onderneming die plat ging. Uit de analyse bleek dat onder druk van het oplossen van het millenniumprobleem er te veel ‘patches’ waren uitgevoerd op de software van SAP. Van Den Bosch: "Toen het eerste probleem optrad, nam iemand een foute beslissing. Daarna trad Murphy’s Law in werking, want de ene fout leidde tot een keten van fouten, met als resultaat dat het systeem negen dagen uit de lucht was."
Het zijn inderdaad gouden tijden voor ‘opslag’-leveranciers. Maar vergeet niet dat veel bewaren ook betekent dat er veel beheerd moet worden – houdt data dus vooral in de hand.
Wim Amerongen, freelance medewerker
Formule 1
Vijf jaar geleden sloop EMC via een achterdeur de wereld van Formule 1 binnen. In 1991 stond de renstal van Eddie Jordan voor een moeilijke beslissing. Er was sprake van een economische recessie en het klimaat voor een entree in het geldverslindende Formule 1-circuit was allesbehalve gunstig. Om door te breken in de autoracerij was uitbreiding naar deze superklasse toch nodig. Als eerste stap werden alle gegevens over de auto in een EMC-systeem opgeslagen en tijdens de race worden die via sensoren vastgelegd. Met die gegevens kunnen technici de onderdelen optimaal afstellen. In de Formule 1 gaat het om minieme verschillen. Daarom is het van het grootste belang dat de racewagen vooraan mag starten (de ‘pole-position’). Maar in de praktijk mogen de renners een beperkt aantal trainingsronden rijden. Eddie Jordan heeft hiervoor een oplossing bedacht. Als zijn team ergens aan de start moet komen, dan zorgt hij ervoor dat een identieke racewagen in het hoofdkantoor in Silverstone staat. "Onlangs was er een race in Australië, waar we maar zestien uur hadden om de auto af te stellen. Toen de eerste trainingsronde erop zat, stuurden we alle gegevens via een satelliet naar Silverstone. Die hebben we vervolgens net zo lang getuned tot hij optimaal was." De getunede gegevens gingen vervolgens weer per satelliet naar Melbourne. De afstelling had succes, want in het laatste testrondje schoof de race wagen tien plaatsen naar voren in de startrij.
Grootgebruikers aan het woord
Een van de grootste computercentra ter wereld staat bij het Cern in Genève. Manuel Delfino, de IT-directeur van dit centrum voor nucleair onderzoek, stelt dat het centrum duizenden opslagsystemen gebruikt. "Nu is de geïnstalleerde capaciteit voor tape en disks samen 200 terabyte. In het jaar 2004 verwacht ik dat we de grens van 1 petabyte (1000 terabyte) gaan overschrijden."
De toename is te danken aan de gegevens die worden verzameld in de deeltjesversneller. De kans dat er bij de botsing iets interessants gebeurt is miniem, maar alle gegevens moet men wel vastleggen om dat te kunnen constateren. Delfino: "In de deeltjesversneller is er elke 25 nanoseconde een botsing, waarvan er 1 per miljard interessant is en slechts 1 keer per triljoen botsingen echt interessant."
In Nederland is één van de grootgebruikers Sara, het rekencentrum van de Universiteit van Amsterdam. Sinds 1991 heeft Sara onder andere opslagsystemen van Storagetek en IBM. De omvang aan opslag verdubbelt per jaar, terwijl het centrum er hetzelfde bedrag aan uitgeeft. Eind dit jaar wil Sara een robot in een centrum in Almere installeren dat dienst doet als backup.
De Rijksdienst voor het Wegverkeer betrekt zijn opslagsystemen van Storagetek en EMC via Unisys. "Wij hebben behoefte aan een partner als Unisys die ons helpt met het vinden van oplossingen", zegt Jan Depping, IT-consultant. Decentraal werkt de RDW met systemen van Compaq. De groei van opslag brengt problemen mee, zo erkent Depping. "Vooral de toename van e-mail en interne agenda’s leidt tot een verdubbeling van de hoeveelheid opgeslagen data. Omdat de interne disks niet uit te breiden zijn, hebben we daar nu problemen mee." Depping ziet meer een oplossing in het automatisch archiveren van documenten.