Ik heb er geen geheim van gemaakt dat ik denk dat ‘peer-to-peer’ een stap terug is en een recept voor nog meer onnodige problemen. Dit geldt echter voor het concept waarbij men alle redundante verwerkingscapaciteit die we ons hebben laten aanpraten, proberen te gebruiken. Maar de toepassing van het concept voor servers, genaamd ‘grid computing’ moet serieus worden genomen.
Er is een toenemende wens om op wereldwijde schaal data te delen en te benaderen via het Web. Daarmee groeit de behoefte om een enkele datapool te creëren waar elke applicatie bij kan. Dat is niet mogelijk met een enkel fysiek systeem, dus is een virtueel concept nodig. Dat betekent dat de applicaties niet hoeven te weten waar de data feitelijk is opgeslagen. Het principe van bladeren (browsing), waarbij url’s worden gebruikt om van de ene webserver naar de andere te gaan zonder aan- of af te loggen, is een uitstekend uitgangspunt. Het is echter niet mogelijk informatie op meerdere servers te combineren tot een enkel virtueel systeem. Dit probleem kreeg de relationele-databasegemeenschap vele jaren geleden voor zijn kiezen, toen het concept van integratie van bedrijfsapplicaties in zijn kinderschoen stond. Het is geen eenvoudige taak om een naadloos aansluitende gedistribueerde database te leveren, en zelfs tegenwoordig bestaan er nog belangrijke beperkingen. Deze zijn grotendeels het gevolg van de behoefte om tijdelijk datasets over netwerken te verplaatsen en om consistentie te garanderen als een enkele machine uitvalt.
Gegeven de beperkingen van het relatief goed gedefinieerde relationele-databasemodel, vormt de huidige vraag naar data, tekst en beeld, en zeker multimedia, een aanmerkelijk grotere uitdaging. Dit lijkt volledig voorbij te zijn gegaan aan de voorstanders van ‘peer-to-peer’. Maar de nuchterder server-broederschap onderschat de problemen.. Zoals we gezien hebben met de ontwikkelingen in opslagtechnologie zoals nas en san, negeert men nog heel naïef het verschil tussen fysieke opslag, ‘filesystems’ en databases. De data moet worden gedeeld, in plaats van de opslag. Met andere woorden, het gedistribueerde database-model is de enige praktische manier om tegemoet te komen aan de vraag naar steeds meer (online) data. Niet dat bijvoorbeeld nas waardeloos is, verre van dat. Het is een technologie van een lager niveau dat nodig is om de database-engines te assisteren.
Hoewel de meeste ontwikkelingen op het gebied van opslag gericht zijn op applicaties voor gegevensverwerking en gegevenspakhuizen, zijn ze net zo goed te gebruiken voor webgebaseerde systemen, als die maar geïmplementeerd zijn als een virtueel subsysteem, en niet een random puinhoop zijn. Dit is de gedachte achter ‘grid computing’: gebruik maken van de technologieën die zijn ontwikkeld voor huidige bedrijfsapplicaties in de nieuwe wereld van e-handel.
Een enkel fysiek systeem is geen optie. Allereerst gaan de te voorziene eisen aan de webserver verder dan de ontwikkelingen in hardware-systemen. We hebben het over duizenden mainframes (tegenover miljoenen pc’s). Dan is er het probleem van het eigendom en de niet onbelangrijke impact van de klantentrouw. Een verstokte HP-klant zal het niet erg vinden om een combinatie te vormen met iemand die Sun- of IBM-apparatuur gebruikt, maar zal niet willen veranderen. Bedenk dat er sprake is van een evolutie en niet van een revolutie, en dus zal het een ontwikkeling van meerdere leveranciers zijn. Hoewel Microsoft zou willen dat alles op .Net gebaseerd is, moeten ze ook met de rest mee. Dan is er het probleem van het netwerk, op twee niveaus: de zeer hoge snelheden die nodig waren voor de servers in het netwerk, en voor de gebruikers. Per gebruiker kan volstaan worden met een lagere snelheid, maar er is een enorm aantal van hen. Een enkele server zou een enorme bottleneck vormen. Dit distributieprobleem pakte IBM met succes aan tijdens de Olympische Spelen.
De echte nachtmerrie is beheer en beveiliging, of liever het gebrek eraan! Hoewel er relatief weinig wordt ingebroken op mainframes en Unix-systemen, zijn Windows-systemen een genot voor hackers. Wacht niet op Microsoft, ondanks toezeggingen om deze problemen te verhelpen in de vertraagde release van de .Net-server. Het probleem zit in het hart van het NT-softwaremodel. Hoewel Microsoft de ‘zachte onderbuik’ heeft waar hackers zo gek op zijn, is de rest verre van perfect. Wil ‘grid computing’ een succes zijn, dan zijn samenwerking en standaarden essentieel. En daarin heeft de it-industrie een belabberde reputatie!
Martin Healey, pionier ontwikkeling van op Intel gebaseerde computers en c/s-architectuur. Directeur van een aantal it-bedrijven en professor aan de Universiteit van Wales.