Naar verwachting zal de markt voor deze raid-systemen in 2002 groeien tot 25 miljard dollar. Grote spelers als IBM en het als een komeet omhooggeschoten EMC zetten de trend naar gecentraliseerde data-opslag. De heilige graal van raid is een opslagsysteem dat zowel voor mainframes als voor Unix- en NT-machines toegankelijk is.
Informatie centraal
Raid is de tastbare ontwikkeling van een groeiende trend in de IT waarbij het beheren van informatie centraal staat en de beschikbaarheid van rekenkracht steeds meer als een natuurlijk gegeven wordt ervaren. "Internet, intranetten, ‘datawarehousing’ of het jaar 2000-probleem, alle trends in dataprocessing wijzen in dezelfde richtig", zegt Ruettgers. "Men wil naar ondernemingsbrede opslag en snelle beschikbaarheid van gegevens voor iedereen." De trend is richting gecentraliseerde data-opslag. De concurrentie in de raid-wereld zal zich in de toekomst dan ook toespitsen op systemen waarin zowel mainframes als Unix en Windows-PC’s toegang hebben tot dezelfde centraal opgeslagen informatie. Nog niemand kan deze volkomen transparante systemen leveren, maar EMC, IBM en andere spelers ontwikkelen hiervoor in hoog tempo de software-technologie. Door de intensieve concurrentie valt er in veel sectoren van de computerindustrie op hardware-gebied geen droog brood te verdienen. Winstgevende markten worden schaarser en spelers pakken nieuwe kansen met beide handen aan. Ook Sun Microsystems heeft raid ontdekt. Het bedrijf laat de vechtmarkt van de werkstations steeds meer over aan fabrikanten van Windows-NT machines en schuift op richting lucratieve servers. Afgelopen zomer kocht Sun de raid-fabrikant Encore Computer Corp. voor 185 miljoen dollar. Daarmee verwierf Sun de kennis om raid-systemen te maken die zijn ontworpen om data op te slaan en beschikbaar te stellen aan mainframes, Unix- en Windows NT-machines.
"Met dataopslag is geld te verdienen, dus is het voor ons van strategisch belang", verklaarde ceo Scott McNealy de stap van Sun. Net als in de markt van werkstations en servers komen er ook op dit gebied fabrikanten die op de goedkope processoren van Intel rekenen. Data General uit Westboro, Massachusetts, bracht afgelopen zomer zijn Aviion AV20000 op de markt, een nieuw raid-systeem op basis van maximaal 32 Pentium Pro-processoren. Dit systeem draait op een eigen versie van Unix (DG/UX). Door middel van clustering is het systeem volgens Data General uit te breiden tot 128 processoren.
Enorme markt
De markt voor raid heeft intussen dermate grote proporties aangenomen dat harddisc-fabrikanten hun producten speciaal zijn gaan ontwikkelen met het oog op toepassing in raid-systemen. Harde schijven vormen daarvan ongeveer een derde van de waarde. Seagate uit Scotts Valley, Californië, heeft zijn nieuwe harde schijven van het type Cheetah speciaal ontworpen met het oog op de Symmetrix-systemen van partner EMC. De schijven braken dit jaar het toerental-record met een omwentellingssnelheid van 10.000 omwentelingen per minuut. In de huidige systemen (van alle fabrikanten) zijn 7200 omwentelingen voor 3,5 inch schijven ‘state of the art’. De Cheetahs zijn tevens uitgerust met de nieuwe snelle interface-standaard Fibre Channel.
Het kan voorlopig niet op in de raid-markt. Dataquest voorspelt dat de markt voor deze opslagsystemen in 2002 in totaal 25 miljard dollar zal bedragen, tegen 10 miljard dit jaar. Ruettgers denkt zelfs dat de markt over vijf jaar 40 miljard dollar groot zal zijn. Niet slecht voor een van oorsprong wat krakkemikkig concept. Want raid is in eerste instantie niet bedacht als de huidige ‘redundant arrays of independent discs’, maar als ‘redundant arrays of inexpensive discs’. Eind jaren tachtig was er een groot verschil tussen dure betrouwbare schijven en goedkope schijven die het wel eens lieten afweten. Men bedacht een tussenoplossing door een fouttolerant systeem te maken met rekken van goedkope harde schijven. Als één van de schijven het begaf, herstelde men de gegevens weer aan de hand van een back-up op de andere schijven. Zo ontstonden de verschillende veiligheidsniveaus raid 1 tot en met 5 die nu nog steeds worden gebruikt.
Nog een ander kenmerk wijst op een piepjong gebied. Het zijn vooral kleine bedrijven die momenteel aan de onderkant van de markt een bloedig gevecht leveren om te overleven. Vorig jaar konden 20 van de 150 bedrijven de race niet meer volhouden. "Het lijkt op de PC-markt in 1984", zegt Ruettgers. "Toen waren er honderden PC-fabrikanten. Als je de top-tien van toen vergelijkt met de top-tien van vandaag, zie je dat er maar een stuk of drie fabrikanten over zijn."
De meeste van deze bedrijven richten zich op kleinere systemen in de onderkant van de markt. Ruettgers: "Doordat ze niet voldoende differentiëren moeten ze op prijs concurreren."
Over de hardware hoeft intussen niemand meer te klagen. De prijzen van schijfeenheden zijn dramatisch gedaald en hebben intussen een hoge betrouwbaarheid. "De 10 megabyte-schijven in de eerste raid-systemen hielden het ongeveer 15.000 uur uit", zegt Ruettgers. "Voor een 1 gigabyte-systeem waren honderd schijven nodig. Dan ging er gemiddeld elke zes dagen eentje stuk. Men had dus niet het gevoel dat er een veilig systeem bestond dat 1 gigabyte kon opslaan. Tegenwoordig hebben we echter schijven van 23 gigabytes. Dat is waarschijnlijk even veel als alle harde schijven in 1984 bij elkaar. Daarvan is de betrouwbaarheid zeer groot. Veel van de problemen uit de jaren tachtig zijn al opgelost door de hardware."
17 Gbyte op 3,5 inch
De ontwikkelingen staan niet stil. Alle technologen zijn het erover eens dat de opslagdichtheid op harde schijven de komende tijd met ongeveer 60 procent per jaar zal blijven toenemen. Nieuwe magnetische media, sensoren in de leeskoppen en geavanceerde elektronica om de zwakke leessignalen op te pikken maken dat mogelijk.
"In 2001 zien we 17 gigabyte op een 3,5 inch schijfje", zegt Jim Porter van marktonderzoeker Disk/Trend in Mountain View, Californië. Dit betekent dat notebooks rond die tijd over 35 Gbyte, PC’s over 60 Gbyte en raid-systemen over harde schijven met ruim honderd Gbytes zullen beschikken. Ook de mechanica van de harde schijven maakt een revolutionaire ontwikkeling door. De bit-sporen op de schijven worden intussen zo dun dat trillingen van de kogellagers in de motor het lezen en schijven kunnen verstoren. Vloeistoflagers kunnen de trillingen met uitwijkingen van 0,2 micrometer zo’n tien keer reduceren tot 0,02 micrometer. EMC’s partner Seagate demonstreerde afgelopen oktober de eerste harde schijf met een vloeistoflager. Terwijl IBM en Hitachi zelf harde schijven van topkwaliteit produceren, moet EMC deze onderdelen inkopen. Niet voor niets ontmoet Ruettgers elk kwartaal Alan Shugart, ceo van Seagate Technology.
Alle geavanceerde hardware ten spijt beschouwt Ruettgers de opgebouwde software-kennis van EMC als zijn grote concurrentiefactor. Tijdens zijn werk als jonge software-ontwerper aan de Patriot-raket leerde hij het belang van goede programmatuur kennen. "De Patriot heeft allerlei hardware-snufjes zoals radar en stuwmotoren. Er is een heleboel geavanceerde software voor nodig om dat alles vlekkeloos te laten samenwerken. De hardware van de Patriot was zeven jaar eerder klaar dan de software. In onze planning had het tegelijk klaar moeten zijn."
Voor commerciële raid-systemen zou een dergelijke vertraging catastrofaal zijn, realiseerde Ruettgers zich. De oplossing kwam in 1992 met EMC’s Mosaic 2000 software-architectuur. Daarmee kon het bedrijf nieuwe hardware meteen in zijn raid-systemen opnemen, terwijl anderen hun systemen opnieuw moeten ontwerpen. "Wij kwamen het eerst met harde schijven van 1, 2, 3 en 9 gigabyte in onze systemen." Volgens de ceo heeft EMC tot nu toe voor in totaal 750 miljoen dollar aan softwareontwikkeling voor Symmetrix uitgegeven. "Dat zijn de investeringen van de laatste zeven jaren. Ik schat dat iedereen die met ons wil concurreren, dezelfde hoeveelheid tijd en geld moet investeren om ons in te halen."
Toegankelijkheid
Vooral kleine bedrijven zullen het nakijken hebben. Dat betekent niet dat Ruettgers met zijn handen over elkaar kan gaan zitten. Zowel IBM als Hitachi beschikt over de middelen en de conditie om de strijd met EMC aan te gaan. Wat betreft technologie van harde schijven is IBM al jarenlang leider. Degger wijst erop dat IBM in 1995 maar liefst 378 patenten ontving op het gebied van opslagsystemen, tegenover 22 patenten voor EMC in datzelfde jaar. IBM was het eerste bedrijf dat schijven met leeskoppen van magneetweerstandmaterialen op de markt bracht. Bij de divisie Storage in San Jose werden tevens de eerste prototype-schijven met koppen van gmr-materialen (giant-magnetoresistance) gedemonstreerd. Deze technologie zal binnenkort in producten worden toegepast. De heilige graal van raid is een opslagsysteem dat zowel voor mainframes als Unix- en NT-machines toegankelijk is. Op deze manier hoeven in een toepassing als ‘datamining’ geen bergen met informatie meer te worden verschoven van een mainframe-omgeving naar Unix-machines. "Ook EMC kan dit nog niet leveren", zegt Degger van IBM. "Datasharing heeft nog niemand. Wat EMC wel heeft, is disc-sharing. Dat is hetzelfde als twee dozen in één verpakking.
Dat hebben wij ook. Later zal data-sharing binnen Seascape volgen." Als IBM erin slaagt om Seascape op de markt te brengen, dan kan het bedrijf weer helemaal terugkomen, menen analisten van Gartner. Seascape vormt de blauwdruk waaromheen IBM zijn toekomstige opslagsystemen ontwikkelt. De architectuur moet ervoor zorgen dat de raid-systemen snel zijn op te bouwen uit standaard componenten, waardoor nieuwe opslagsystemen sneller op de markt zijn te brengen. IBM heeft Seacape afgelopen zomer geannonceerd. Bestaande bouwblokken van Seascape zijn de SSA-interface, Network Storage Manager en Virtual Tape Server.
Centrale opslag
Begin dit jaar introduceerde EMC zijn nieuwe Datareach-software waarmee de verschuiving van data van mainframes naar open systemen een stuk sneller verloopt. Ruettgers voorspelt dat deze technologie de komende jaren een grote impact zal hebben. Voor het maken van datapakhuizen moeten bedrijven nu vaak honderden gigabytes aan informatie transporteren van operationele mainframes naar analyse-systemen op Unix of NT. Met traditionele methoden neemt deze gegevensoverdracht vele uren in beslag. Met Datareach kunnen de Symmetrix systemen hun data binnen enkele minuten lezen en versturen. Over IBM’s pogingen is Degger laatdunkend. "IBM praat intussen weer over zijn nieuwe architectuur Seascape. Dat doen ze nu al vier jaar. Als ze hun eigen deadline halen, dan liggen ze twee jaar achter op het gebied van open systemen en 3,5 jaar op het gebied van de mainframes."
"Seascape is nu en ook volgend jaar nog niet af. We hebben het over een architectuur, waaromheen zich steeds meer producten verzamelen", zegt Degger. "Onze software voor gegevensbeheer, Snapshot en Adsm, is uniek in de markt. Vooral Adsm is zeer succesvol. Sunworld koos deze technologie in 1995 tot het meest innovatieve nieuwe product". De komende jaren zal de bandbreedte van raid-systemen steeds meer toenemen. De industrie maakt momenteel de overstap van de parallelle Scsi (signal computing system architecture) naar de seriële Fibre Channel-interface. Ook de raid-bank Aviion AV20000 van Data General is leverbaar met een Fibre Channel-interface. In tegenstelling tot fabrikanten van harde schijven en raid-opslagsystemen zijn de computerleveranciers traag in de overstap naar Fibre Channel. Als een van de eersten startte Hewlett-Packard in het derde kwartaal van 1997 de verkoop van EMC Symmetrix-3000-systemen met een Fibre-Channelverbinding naar HP 9000 Enterprise Servers.
De voordelen van Fibre Channel reiken veel verder dan alleen meer bandbreedte. Fibre Channel maakt het mogelijk om de dataopslag te centraliseren waarbij een grotere fysieke afstand tot servers mogelijk is. Met Scsi is de afstand van opslag tot dataverwerking tegenwoordig gelimiteerd tot 25 meter. Met Fibre Channel kan de onderlinge afstand toenemen tot 10 kilometer. Ruettgers: "Daarmee kan de informatie in grote bedrijfsnetwerken, zoals op een campus, worden gecentraliseerd, terwijl iedereen er toch snel over kan beschikken."
In tegenstelling tot de rest van de industrie kiest IBM voor SSA, een fout-tolerante hardware-interface. "Wij leveren al anderhalf jaar SSA, terwijl Fibre Channel nog nauwelijks wordt verkocht", zegt Degger. SSA verbindt computers en opslagsystemen door middel van een ringvormig netwerk. Als er op één plaats een fysieke breuk in het netwerk optreedt, blijft alle apparatuur nog steeds verbonden. Bovendien levert de tweezijdige SSA-aansluiting een hogere bandbreedte. Dat Ruettgers niet is gecharmeerd van deze oplossing zal niemand verbazen. "Alleen IBM heeft SSA. Verder niemand. Dus ik verwacht dat ze op den duur wel zullen overstappen op Fibre Channel." IBM bestrijdt dit. "Ook SSA is als open industriestandaard vastgelegd. Het wordt ondermeer ondersteund door servers van HP, Sun, Dec, Compaq", aldus Degger.
René Raaijmakers, freelance medewerker Computable