Nooit ging de zon onder over het machtige Britse koloniale rijk aan het begin van de twintigste eeuw. Op ieder moment van het etmaal zagen wel ergens ter wereld een paar onderdanen-tegen-wil-en-dank van koningin Victoria de zon aan de kim verschijnen. Anno 2000 kunnen we hetzelfde zeggen over onderzoek en ontwikkeling bij IBM.
Immers, wanneer de R&D onderdanen van Louis Gerstner – ook wel King Louis – zich in het Almaden Research Center in Californië opmaken om naar huis te gaan, draait een vroege vogel bij IBM in het Japanse Yamamoto het licht al weer aan. IBM’s R&D is een 24-uur per etmaal onderneming verspreid over acht grote en kleine R&D labs: Yorktown Heights (New York), Austin (Texas), Almaden (Californië), Yamamoto (Japan), Beijing (China), Delhi(India), Haifa (Israël) en Zurich (Zwitserland). Al deze labs, waar al met al zo’n drieduizend mensen werken, zullen de komende vijf jaar in meer of mindere mate betrokken zijn bij IBM’s volgende reuzenproject: het bouwen van een petaflop supercomputer.
Nu IBM met Deep Blue bewezen heeft een supercomputer te kunnen maken die schaakwereldkampioen Gary Kasparov schaakmat zet, richt het bedrijf zich op een nieuwe horizon: eiwitten! IBM’s volgende supercomputer – die de koosnaam Blue Gene heeft gekregen – zal niet proberen de strategische finesses van de wereldkampioen onschadelijk te maken. Nee, Blue Gene zal gaan onderzoeken hoe eiwitten zich vormen in Kasparovs lichaam (en dus ook in de lichamen van andere mensen). Misschien zal Blue Gene ons ooit leren begrijpen waarom Gary’s hersenen, die immers voornamelijk bestaan uit eiwitten en water, hem beter laten schaken dan de rest van de mensheid.
Biologisch proces
De vorming van eiwitten uit aminozuren, een proces waarvoor de bouwinstructies zijn opgeslagen in onze genen, is één van de belangrijkste en meest complexe biologische processen. Het begrijpen hoe eiwitten zich vormen, is essentieel voor het begrip van processen in het menselijk lichaam en evenzeer voor het beter kunnen bestrijden van allerlei ziekten. Die goeie ouwe Deep Blue zou er echter naar schatting zo’n 300 jaar over doen om de vorming van een relatief eenvoudig eiwit in 3-D te simuleren. Vandaar dus dat er vanuit de medische wetenschap en de biologie een vraag is naar nog snellere supercomputers. Vandaar dus, Blue Gene.
IBM heeft 100 miljoen dollar uitgetrokken om Blue Gene te bouwen. Als dat inderdaad in vijf jaar lukt, belandt de Wet van Moore op de schroothoop. Volgens deze wet – die zegt dat de rekenkracht van microprocessors iedere achttien maanden verdubbelt – zijn we pas in 2015 toe aan een petaflop computer, een computer die een biljard drijvende komma berekeningen per seconde uitvoert, ofwel een 1 met 15 nullen. IBM denk dus al aan 2005. Blue Gene wordt een zogenaamd massaal parallelle computer die gebruikt maakt van enorme stacks aan parallel opererende microprocessors. Maar verder zal de computer een radicaal nieuwe architectuur krijgen die afwijkt van Deep Blue en die men bij IBM omschrijft als SMASH. En SMASH staat voor Simple, MAny en Self-Healing.
Simpele architectuur
De architectuur van Blue Gene wordt ‘simpel’ omdat de supercomputer zal bestaan uit 32.000 maal dezelfde bouwsteen: een chip met afmetingen van 20 x 20 mm waarop niet minder dan 32 processors zitten. Ook wordt de risc-architectuur van de chips vereenvoudigd. De risc instructieset – de totale vocabulaire van instructies in machinetaal die de chip begrijpt – zal bij Blue Gene bestaan uit slechts 57 instructies. Nu gangbare risc-chips gebruiken ongeveer tweehonderd instructies. De ‘many’ in SMASH staat voor veel racks, veel boards, veel chips en veel microprocessors. Blue Gene zal bestaan uit 64 racks of computing torens van ieder twee meter hoogte, op ieder rack zitten acht moederboards, op iedere board zitten 64 chips en iedere chip heeft de beschikking over 32 microprocessors. In totaal krijgt Blue Gene dus zo de beschikking over de rekenkracht van 1.048.576 microprocessors.
Een van de meest revolutionaire vernieuwingen in Blue Gene’s architectuur is de embedded memory: dram-opslag en dataprocessing op één en dezelfde chip. De zogenoemde processor-to-memory-vertraging, ofwel de tijd die nodig is om data van het geheugen naar de microprocessor te transporteren, is een belangrijke rem op de snelheid van computers. Dankzij doorbraken op het gebied van miniaturisatie wordt het volgens IBM mogelijk logische circuits en geheugencircuits op één chip op elkaar te stapelen waardoor de processor-to-memory-vertraging vrijwel nihil is. Daarbij krijgt iedere chip de beschikking over zes kanalen die ieder data verzenden met een snelheid van twee gigabyte per seconde. De totale bandbreedte voor de interne communicatie in Blue Gene is 300 terabyte per seconde. De combinatie van het ingebedde geheugen met de grote interne bandbreedte zorgt in belangrijke mate voor de snelheid van de supercomputer.
Self healing
De grootste uitdaging in het SMASH concept is wel dat de supercomputer self-healing moet zijn. Dat betekent dat wanneer er één of meer processors uitvallen de software van Blue Gene moet zorgen voor de omleiding van data naar andere processors. Wie een ‘hoe-maak-ik-eiwitten-uit-aminozuren’ simulatie van een paar maanden draait, wil niet dat het hele zaakje krakend tot stilstand komt bij het uitvallen van een enkele processor. Door de enorme overdaad aan processors en kanalen kan er altijd een andere weg worden gevonden om data te verwerken. Ook de vereenvoudiging van de architectuur betekent dat een groot deel van de complexiteit van de vorming van eiwitten wordt verschoven van de hardware naar de software. Volgens Ambuj Goyal, IBM’s Research vice-president computer science, ligt de grootste uitdaging bij het bouwen van Blue Gene dan ook op het terrein van de software.
Lange weg
Dit is allemaal natuurlijk heel nieuw en indrukwekkend. Maar hoe lang gaat deze Blue Gene er nu over doen om de vorming van één niet al te complex eiwit te simuleren? Het antwoord: ongeveer een jaar. Wie dus denkt dat Blue Gene net zo goed eiwitten kan simuleren als Deep Blue kan schaken, heeft het dus helemaal mis. Het lichaam van Kasparov – en uw lichaam dus ook – maakt zo’n eiwit in een fractie van een seconde. IBM heeft dus nog een lange weg te gaan wil het ook op dit terrein de mens verslaan.