Waar je tien jaar geleden een cluster van krachtige pc’s voor nodig had, zit nu aan rekenkracht in een enkele chip verwerkt. Wanneer meerdere clusters aan elkaar worden gekoppeld, ontstaat een virtuele supercomputer met enorme rekenkracht. “Grid computing is niet meer weg te denken uit onze maatschappij”, zegt ‘uitvinder’ Carl Kesselman.
Grid computing staat voor het aan elkaar koppelen van meerdere computers, met als doel de rekenkracht te delen waardoor taken vele malen sneller uitgevoerd kunnen worden. Een grid kan al beginnen bij een kleinschalig netwerk van een aantal pc’s tot en met clusters van supercomputers. Dankzij de groei van breedband en met name glasvezelverbindingen (tot zo’n 10 Gbit/s) wordt het steeds eenvoudiger om grootschalige grids op te zetten. En betaalbaar ook, want het bundelen van computers is vaak goedkoper dan een enkele supercomputer aanschaffen. Projecten in de wetenschap, waarbij bijvoorbeeld weersomstandigheden of het ontstaan van de big bang gesimuleerd worden, produceren petabytes aan informatie die normaliter alleen door een cluster van supercomputers verwerkt kunnen worden. Met gedistribueerde computerkracht kan dat vaak veel sneller, omdat het aantal deelnemende krachtbronnen onbeperkt is. Daarbij moet wel de kanttekening geplaatst worden dat niet iedere computer hiervoor interessant is; de voorkeur ligt bij professionele werkstations over glasvezel. Wanneer het aanvoeren van gegevens over breedband langer duurt dan het berekenen van een klus, heeft deelname geen enkele zin.
Toch heeft grid computing juist faam gemaakt met publieke projecten als SETIhome, dat grotendeels gebaseerd was op het gebruik van doodnormale thuiscomputers via het internet. Bij dit project werden radiosignalen uit de ruimte opgevangen door gevoelige telescopen en geanalyseerd door een grid van computers, op zoek naar signalen van buitenaardse intelligentie. Iedereen met een pc kon de wetenschap een handje helpen door ongebruikte capaciteit beschikbaar te stellen. Moderne computerchips hebben zoveel rekenkracht dat ze een groot deel van de tijd vrijwel niets te doen hebben. Met distributed computing wordt de onbenutte capaciteit ingezet voor andere taken, zoals berekeningen voor wetenschappelijke doelen. SETIhome bestaat nog steeds in kleinschalige vorm, maar de groene mannetjes zijn nog niet ontdekt.
Inmiddels zijn er tal van andere initiatieven gestart, zoals onderzoeken naar ziekten (kanker, aids) en andere academische projecten met wetenschappelijk onderzoek. Overigens staat de term ‘grid’ niet per definitie voor rekenkracht. Er bestaan ook datagrids, waarbij de aangesloten computers gezamenlijk informatie beheren, zoals bedrijven die elkaar toegang verlenen tot bestanden of de in het particuliere circuit bekende peer-to-peer netwerken.
Commercieel gebruik
Hoewel het gebruik van data- en rekenkundige grids in de wetenschappelijke wereld vrij gebruikelijk is, maakt het bedrijfsleven er nog opvallend weinig gebruik van. Volgens Carl Kesselman, professor computerwetenschappen aan de universiteit van Zuid-Californië en directeur van het Center for Grid Technologie Information Sciences Institute, is dat slechts een kwestie van tijd. “Het heeft ook jaren geduurd voordat bedrijven commercieel gebruik gingen maken van het wereldwijde web, terwijl het op universiteiten al jaren gebruikt werd.” Kesselman, die wereldwijd bekend is door zijn publicatie ‘The Grid: blueprint of a new computing infrastructure’ in 1999, wordt ook wel de uitvinder van ‘het grid’ genoemd. Hij stond lange tijd aan het hoofd van Globus toolkit, een open source software toolkit om gridsystemen en -applicaties te bouwen. In januari dit jaar ontving hij voor zijn werk een eredoctoraat van de universiteit van Amsterdam.
De uitvinding van het grid kan volgens wetenschappers gelijkgesteld worden aan de impact van het internet. Het heeft wereldwijd geleid tot een lawine van nieuwe onderzoeken en een enorme impuls gegeven aan globale samenwerking op het gebied van onderzoek, gegevens en experimenten. Hoewel ook het bedrijfsleven bijzonder gebaat is bij deze nieuwe infrastructuur van de informatietechnologie, ligt het probleem juist vooral bij het laatste punt: samenwerking. “In de wetenschappelijke wereld is er al veel sprake van samenwerking en ligt het delen van informatie niet zo gevoelig”, verklaart Kesselman. “Voor commercieel gebruik ligt dat anders. Er is sprake van concurrentie, verschillende belangen en gevoelige informatie. Ondernemingen willen bedrijfskritische gegevens het liefst binnenshuis houden en zullen zonder keiharde veiligheidsgaranties niet snel gebruik maken van openbare grids. Voor het opzetten van een grid heb je een virtuele organisatie nodig, bestaande uit verschillende bedrijven die bereid zijn onderling rekenkracht en informatie te delen.”
In de VS hebben verschillende bedrijven al geprobeerd om grid computing aan de man te brengen, maar dat heeft tot nu toe vooral tot mislukkingen geleid. In 1997 startte het Amerikaanse bedrijf Entropia als eerste met een commerciële dienst om rekencapaciteit aan bedrijven te leveren. Het maakte zowel gebruik van een eigen serverinfrastructuur, als van rekenkracht uit een wetenschappelijk grid, waarvan het sponsor was. Het leek utopisch; apparatuur beschikbaar stellen voor wetenschappelijk doeleinden en de kosten daarvan terugwinnen door een deel van de rekencapaciteit op commerciële basis te verkopen. Het bedrijf staakte de commerciële activiteiten in 2004.
Grid-providers
Volgens Ad Emmen, initiatiefnemer van EnterTheGrid en AlmereGrid, is het mixen van commerciële en publieke rekenkracht gedoemd te mislukken. “Het probleem zit hem niet alleen in de diversiteit van thuisgebruikers en middelgrote bedrijven die rekenkracht ter beschikking stellen, maar ook in de effectiviteit daarvan. Duizend kuikens leveren samen ook één pk, maar dat wil niet zeggen dat ze hetzelfde kunnen als een paard. Bij het gebruik van virtuele supercomputers op basis van een grid worden de taken opgesplitst in deeltaken en volgens verdeelt onder de beschikbare computers. De verbinding tussen deze computers in het grid vormt dan de bottleneck. Een adsl-verbinding van 8 Mbit is voor thuisgebruikers het summum, maar in vergelijking met glasvezelnetwerken is dat voor veel doeleinden te traag. Een supercomputer biedt een zeer lage ‘latency’ en beschikt over supersnelle verbindingen tussen alle processors, waardoor die veel beter in staat zijn om intensieve berekeningen als klimaatsimulaties uit te voeren.”
Zowel Kesselman als Emmen zien wel brood in een ander commercieel model, waarbij bedrijven rekenkracht verhuren op basis van clusters van supercomputers in eigen beheer. IBM, Sun en HP zijn al enkele tijd als ‘Grid ISP’s’ actief. Zo verhuurt Sun in Europa en de Verenigde Staten computercapaciteit onder de naam Sun Connection gridcenters voor een dollar per processor per uur. Voor de dienst wordt gebruik gemaakt van het besturingssysteem Solaris 10 en de rekenkracht wordt verzorgd door Suns eigen UltraSparc-processor, aangevuld met AMD Opterons. Ook IBM levert vergelijkbare diensten en heeft vijf jaar geleden onder andere met de Open Grid Services Architecture (OGSA) een wereldstandaard gezet, waarmee diensten in een grid aangeboden kunnen worden. Deze standaard is overgenomen door het Global Grid Forum (GGF) en Globus (van Carl Kesselman).
Rekenkracht kan worden verkregen door zowel de inzet van grid als door een centrale supercomputer, die op zich ook weer kan participeren in een grid. Zo is IBM onder andere bekend van de Blue Gene/L supercomputer. Voor bedrijven die zich geen supercomputer kunnen veroorloven, of de faciliteiten slechts periodiek nodig hebben, is het huren van een grid een goedkoper alternatief.
Bij het Oostenrijkse Magna Steyr, dat onderdelen voor auto’s ontwerpt, heeft IBM een implementatie gedaan om door middel van grid de zogenaamde ‘Clash analyses’ te versnellen. Dit zijn analyses uitgevoerd op componenten van een auto om hun beste positie te bepalen, hierbij rekeninghoudend met de vrijheidsgraden onder extreme omstandigheden (bijvoorbeeld dat een portier altijd open kan). “De doorlooptijd van zo’n analyse is door inzet van gridtechnologie met ongeveer een factor 18 naar beneden gebracht”, volgens Ellis Zijlstra, verantwoordelijk voor de corporate communication van IBM’s Innovatie initiatieven. “Binnen IBM zelf maken we ook gebruik van een intra-grid, onder andere om simulaties voor de ontwikkeling van mainframe-processoren op uit te voeren. En in Frankrijk en de VS bieden we ook diensten aan waarbij bedrijven op afroep computercapaciteit kunnen inhuren.”
Veiligheid en vertrouwen
Grids mogen dan een kostenbesparende en effectieve oplossing zijn, veel bedrijven zijn alsnog huiverig om voor bedrijfskritische processen externe hulp in te roepen. Immers, zij moeten dan een deel van hun computeromgeving vrijgeven aan anderen. Volgens Carl Kesselman is het vooral een kwestie van vertrouwen, in combinatie met veiligheid. “Vanaf het begin hebben we ons gerealiseerd dat de beveiliging een heel belangrijk onderdeel is van een grid. Wie maximale veiligheid wil, kan het beste zijn computer niet meer op internet aansluiten, maar dat is niet meer van deze tijd. Het veiligheidsvraagstuk is complex, maar er zijn verschillende oplossingen voor, bijvoorbeeld en goede firewall, gespecialiseerde beveiligingssoftware en het opstellen van waterdichte regels en protocollen. Het splitsen van taken in deeltaken draagt ook aan de veiligheid daaraan bij, omdat een rekeneenheid dan dus nooit de volledige taak te zien krijgt. Tenslotte is encryptie een mogelijk hulpmiddel. Het is niet onkraakbaar, maar je hebt er bij wijze van spreken wel een ander grid met supercomputers voor nodig om binnen te komen. Het doel gaat dan het nut voorbij. Op dit moment zijn we met Globus druk bezig om een uniforme standaard neer te zetten op het gebied van veiligheid.”
Ad Emmen van AlmereGrid vult aan: “Ons grid is zo opgezet dat de computer die rekenkracht levert contact zoekt met de grid-server en niet andersom. Daarmee voorkom je dus dat iemand van buitenaf kan binnendringen. Het opstarten van programma’s werkt niet en de grid-software heeft slechts toegang tot een klein deel van de harde schijf. Het project draait nu ruim een jaar en er is nog nooit ingebroken. Iemand die misbruik wil maken van distributed computing kan beter gebruik maken van zombie-pc’s, zoals bij ddos-aanvallen gebeurt.”
AlmereGrid is overigens een stichting die een grid ter beschikking stelt aan universiteiten, ten behoeve van wetenschappelijk onderzoek. Participanten zijn zowel lokale bedrijven en particulieren die met onbenutte computercapaciteit een steentje bijdragen aan ‘digitale’ goede doelen. De Stichting, gesponsord door onder andere de Rabobank, IBM en rekencentrum Sara, heeft geen commerciële plannen maar sluit dit ook niet expliciet uit.
Kesselman verwacht dat grid computing uiteindelijk een integraal onderdeel wordt in het dagelijks leven. In de wetenschap zal het een prominente rol blijven spelen door het tempo van onderzoeken te versnellen en de mogelijkheden te verbreden. Het bedrijfsleven overwint uiteindelijk waarschijnlijk de weerstand, in ruil voor meer flexibele rekenkracht. Ook de eindgebruiker haalt er indirect voordeel uit, wellicht door complexe video- en fotobewerkingen in de toekomst uit te besteden aan een grid.
Carl Kesselman
Kesselman is verbonden aan de Universiteit van Zuid-Californië, directeur van het Center for Grid Technologies en research professor computerwetenschappen. Hij houdt zich voornamelijk bezig met de infrastructuur van ‘het grid’, dat mede door hem is uitgevonden. Het meeste van zijn tijd besteedt hij aan de ontwikkeling van Globus toolkit, de onderliggende infrastructuur van de meeste grote grid projecten. Na een aardbeving in 1996, waarbij zijn huis werd beschadigd, raakte hij geïnteresseerd in de manier waarop grid technologie aardbevingen kon analyseren. In 1998 ontving hij de ‘Global Information Infrastructure’-prijs in de categorie ‘Next Generation Infrastructure’. Een reeks prijzen volgden, waaronder een prijs voor de meest veelbelovende nieuwe technologie , opname in de R&D 100 en top 10 innovators en tenslotte een eredoctoraat van de Universiteit van Amsterdam begin 2006.