Met ruim veertien teraflops heeft de SARA Reken- en Netwerkdiensten vanaf eind mei een van de krachtigste computers ter wereld in huis. Computable volgt deze weken de opbouw van het apparaat, dat bij IBM in de Verenigde Staten getest wordt. Deel 4: configureren en beheren.
Omdat de supercomputer in de Verenigde Staten al getest is, hoort hij het na installatie meteen te doen. Toch volgt allereerst nog een viertal acceptatietests. De eerste is eenvoudig: een inventarisatie. Ofwel, is alles wat beloofd was ook daadwerkelijk geleverd? Dan volgt de functionaliteitstest: doet hij wat is afgesproken? Daarbij wordt bijvoorbeeld gekeken of hij snel en netjes opstart bij een herstart (reboot).
Voor de prestatietest wordt teruggegrepen op de benchmark op grond waarvan de machine van IBM als beste uit de aanbesteding kwam. Presteert de machine inderdaad volgens de specificatie? De laatste is de betrouwbaarheidstest. Daarvoor draait het systeem een aantal dagen op volle kracht, terwijl de systeembeheerders toekijken of het aantal incidenten binnen de perken blijft.
“Pas als de machine al die tests goed doorstaan heeft, accepteren we de levering”, aldus manager dr. ir. Axel Berg van de afdeling High Performance Computing en Visualisatie. “Daarna gaan we de machine zelf nog configureren en gebruiksklaar maken voor onze klanten. De toegangsrechten van gebruikers moeten bijvoorbeeld ingesteld worden, het bestandssysteem ingericht. Daar zijn onze beheerders al voor de daadwerkelijke komst van de machine druk mee in de weer.”
Firmware
Uiteraard wordt de machine geleverd met verschillende monitoring tools. Bovendien ontwikkelt SARA veel tools zelf. Die monitoring is zoveel mogelijk geautomatiseerd. Berg: “Als ergens iets niet goed functioneert, is het verschrikkelijk moeilijk te achterhalen wat er mis is: een fout in de software, in de firmware, of wellicht een kapotte kabel. Vandaar dat monitoring zo belangrijk is.”
Omdat de supercomputer uniek is, kun je hem niet zoals een netwerkserver even uitschakelen om te kijken wat er aan de hand is, terwijl andere servers het verkeer opvangen. Het is een duur apparaat waar het maximale rendement uit gehaald moet worden zolang hij niet verouderd is. Ook tijdens onderhoudswerkzaamheden zal het apparaat zoveel mogelijk moeten doordraaien.
Een ander uniek beheeraspect van een supercomputer is de noodzaak van scheduling. Optimaal gebruik van de rekenkracht vergt een slimme indeling van de verschillende klussen. Het netjes inpassen van de taken, rekening houdend met onder meer cpu-tijd, data-throughput en opdeling van de klus over de beschikbare processoren, is geen sinecure.
“Vergelijk het met Tetris”, zegt Berg. “Als je allemaal blokjes van één bij één in elkaar moet passen, is het eenvoudig, maar het inpassen van grote blokken is lastig. Die laatste moeten echter ook aan bod komen. Veel van de grote wetenschappelijke doorbraken steunen tegenwoordig immers op grootschalig rekenwerk. Om die ‘grand challenges’ is het immers voor een belangrijk deel begonnen.”
Supercomputer gearriveerd
De nieuwe nationale supercomputer Huygens is begin deze week afgeleverd bij rekencentrum SARA. De IBM-machine, in de huidige uitvoering uitgerust met Power5+-processoren, wordt in de komende weken opgebouwd en getest door IBM-ingenieurs. Daarna pas mogen de experts van SARA eigen tests uitvoeren. De afgelopen weken is de oude supercomputer ontmanteld en afgevoerd. Die machine bestond eigenlijk uit twee computers: een SGI Origin en een later bijgeplaatste SGI Altix. In afwachting van de nieuwe, veel krachtigere super is de computerruimte al voorbereid, onder met een nieuw koelingssysteem.