IBM brengt zijn nieuwe Power6-processor op de markt. Hoewel deze een logisch vervolg is op de Power5, gaat hij twee keer zo snel. Bovendien zorgt van het mainframe afkomstige technologie voor een grotere betrouwbaarheid.
De Power-processoren van IBM vinden hun oorsprong in de RISC/Unix-wereld. Het bedrijf heeft tijdens de evolutie van deze architectuur echter ook altijd het gebruik voor grotere platforms voor ogen gehad. Zo wilde IBM destijds de PowerPC spin-off, een gezamenlijke ontwikkeling met Apple en Motorola, ook in zijn grote RS/6000 en zijn AS/400-systemen kunnen gebruiken.
Het resultaat van diverse simultane ontwikkelinspanningen was de introductie van de 64-bits Power3- en RS64-processoren in 1997. De eerste was een combinatie van de Power2 en de PowerPC, voorzien van uitbreidingen voor de AS/400. De tweede was een PowerPC voorzien van Power2- en AS/400-uitbreidingen. Belangrijkste verschil tussen deze twee lijnen was dat de AS64 niet geoptimaliseerd was voor floating point operaties. Die waren immers niet belangrijk voor de AS/400-systemen die vooral administratieve toepassingen draaiden.
In 2001 introduceerde IBM de Power4, de opvolger van zowel de Power3 als de RS64. De Power5 verscheen twee jaar geleden. Naast uitbreidingen van de instructieset bevatte deze twee kernen, die elk weer twee verschillende threads konden draaien. De Power5+ breidt de instructieset nog verder uit. Daarnaast ondersteunen deze processoren de Virtual Vector Architecture (ViVA). Door meer processoren parallel te schakelen, kunnen hiermee systemen worden gebouwd die grote hoeveelheden data op vergelijkbare wijze kunnen verwerken zoals supercomputers dat doen.
Parallel systeem
De introductie van de Power6 processor heeft IBM opgehangen aan het schaaktoernooi dat precies tien jaar geleden plaatsvond. Op 11 mei 1997 versloeg de Deep Blue computer in de herkansing de toenmalige wereldkampioen Garry Kasparov. “Dit project startte een paar jaar hiervoor,” vertelt Bill Zeitler, senior vice president en group executive van de IBM Systems and Technology Group. “We realiseerden ons toen dat een heleboel actuele problemen niet konden worden opgelost met de grote monolithische supercomputers van die tijd. Vandaar dat wij voor dit schaaktoernooi een geclusterd parallel systeem bouwden. Die aanpak wordt inmiddels ook door de meeste van onze concurrenten gebruikt.”
“In die tijd zijn we ook de ontwikkeling van de Power4-processor gestart,” vervolgt Zeitler. “De Alpha van DEC was toen de snelste processor. Wij hadden bedacht dat het gebruik van meerdere kernen op één chip belangrijker zou worden dan het aantal Gigahertzen. Vijf jaar later introduceerden we de Power4, en dat heeft ons een heleboel voordeel in de Unix-markt opgeleverd.”
Dat was voor IBM ook de belangrijkste reden om Londen te kiezen voor de lancering van de Power6. “Het Verenigd Koninkrijk, en dan in het bijzonder Londen, is de vijfde Unix-markt ter wereld,” aldus Larry Hirst, de general manager voor het Verenigde Koninkrijk, Ierland en Zuid-Afrika. Hij noemt met name de bank- en verzekeringswereld als grootverbruikers van Unix-systemen.
Met de introductie van de Power6 bouwt IBM verder op de architectuur van zijn voorloper. Belangrijkste verkoopargument zijn de verdubbelde prestaties bij gelijkblijvend stroomverbruik. “Iedereen is bezig met klimaatverandering,” zegt Hirst, “Managers vragen mij nu hoeveel ze het milieu belasten. It wordt als de slechterik gezien.” Innovatie is volgens Hirst echter juist een manier om het energieverbruik omlaag te brengen.
Kloksnelheden
De kloksnelheden van de Power6 variëren nu tussen de 2,5 en 4,7 GHz, maar de verwachting is dat deze lijn in de toekomst de 6 GHz kan bereiken. Hoewel IBM tijdens de introductie de nadruk legt op energie-efficiëntie, komt er pas na enig aandringen uit dat de Power6 ongeveer 100 watt op 3,5 GHz en 160 watt op 4,7 GHz verbruikt. Uiteindelijk praat men toch liever over de snelheid van de nieuwe processor en de prestaties van de nieuwe System p 570 server.
De interne databus van de Power6 heeft een bandbreedte van 300 Gbyte per seconde. Op die snelheid zou je de hele iTunes catalogus van 20 Terabyte in 66 seconden kunnen downloaden. Hoewel dat natuurlijk een onzinnige vergelijking is – die snelheid kan alleen diep in het hart van de processor gehaald worden – geeft het wel aan dat de Power6 hard gaat. Met de introductie van de 570 publiceerde IBM maar liefst 25 benchmark-records. Volgens het bedrijf is het bovendien de eerste keer dat een Unix-systeem tegelijkertijd de vier belangrijkste records (SPECint2006, SPECfp2006, SPECjbb2005 en TPC-C) in handen heeft.
Mainframe
Zoals IBM meer dan een decennium geleden de Power-architectuur geschikt wilde maken voor de grote RS/6000 en de AS/400-systemen, zo is het bedrijf de afgelopen jaren bezig geweest hetzelfde te doen voor de mainframes. "Toen we aan het ontwerp van deze processor begonnen," vertelt Bradley McCredie, IBM fellow en de hoofdontwerper van de Power6, "hebben we de mainframe- en Unix-teams samengevoegd en steeds onderling technologie uitgewisseld. Meest in het oog springende resultaat van die samenwerking is de ‘checkpoint restart and retry.' Daarbij worden de uitkomsten van alle instructies continu gecontroleerd. Als er een fout optreedt, wordt de laatste status teruggezet en worden dezelfde instructies opnieuw geprobeerd. Dat is iets dat we voor de mainframe al jaren doen."
In de toekomst zal deze technologie nog verder worden uitgebouwd met de zogenaamde ‘hotspare'-functionaliteit. "Als een processor stuk blijkt te zijn, wordt de workload automatisch naar een reserveprocessor of een ander computersysteem verplaatst."
In de war
Een andere nieuwe techniek die afkomstig is van het mainframe, is het gebruik van ‘storage keys'. "De meest voorkomende systeemproblemen ontstaan als software in de war raakt en door het geheugen begint te dwalen", aldus McCredie. "Daar overschrijft het geheugenlocaties waar het helemaal niets te zoeken heeft. Om dergelijke problemen te voorkomen hebben we een hardwarematige bescherming ingebouwd. De programmeur kan nu stukken geheugen beschermen met een sleutel. Softwareonderdelen die daar niets te zoeken hebben, wordt de toegang geweigerd. Alleen de onderdelen met de juiste sleutel mogen het betreffende geheugen benaderen."
Deze bescherming is niet iets dat vanzelf gaat, maar moet door de programmeur expliciet toegepast worden. "Hij kan dat doen per processor, per thread of volgens een andere indeling", aldus McCredie. Zelf heeft IBM dit al gedaan voor de volgende versie van AIX, die in november uitkomt. "De kernel van AIX 6 zal vier tot vijf van dergelijke sleutels krijgen. Elk onderdeel heeft dan zijn eigen afgeschermde stuk geheugen. Vanaf dan is deze functionaliteit ook voor de eindgebruiker beschikbaar."
Petaflops
De komende jaren zullen we nog veel meer uit de mainframe afkomstige technologie terugzien in de Power-architectuur. Op dit moment werkt IBM bijvoorbeeld aan de verdere uitbreiding van de vectormogelijkheden. Het bedrijf ontwikkelt in opdracht van het Amerikaanse Ministerie van Defensie een petaflop-systeem. Dat is nog eens duizend keer sneller dan de teraflop-systemen die Intel en AMD de afgelopen tijd hebben laten zien. Omdat deze petaflop-processor op de huidige Power gebaseerd zal zijn en ook commercieel verkrijgbaar, is de verwachting dat deze ontwikkelingen over een paar jaar in de Power7 verwerkt zullen worden.
Zelfde socket als Opteron
The Register en The Inquirer hebben onafhankelijk van elkaar bericht dat de Power7 dezelfde bus-interface zal krijgen als de toekomstige Opteron-processoren van AMD. Als dat waar is, kruipen de X86-servers en de high-end RISC-systemen weer een stuk dichter bij elkaar. En gezien de hechte samenwerking tussen IBM en AMD op gebied van de chipproductie zou dit best eens het geval kunnen zijn. Intel is immers met een vergelijkbare ontwikkeling bezig. Dat bedrijf zal de volgende generatie Itanium- en Xeon-processoren van dezelfde bus voorzien.
De nieuwe Common System Interconnect (CSI) van Intel is vergelijkbaar met de HyperTransport-interface van AMD. Processoren zullen zowel lokaal geheugen hebben als een verbindingsbus naar andere processoren en hun geheugen. Daarmee verdwijnt de bekende Front-Side Bus (FSB), en wordt de zogenaamde northbridge (dat deel van de chipset dat zorgt voor de verbinding tussen de processor, het geheugen en de snelle video-interface) in de processor zelf opgenomen.
Spelconsoles
De toepassing van de Power-architectuur beperkt zich niet tot serversystemen alleen. IBM heeft samen met Sony en Toshiba de Cell Broadband Engine ontwikkeld. Deze processor bestaat uit een Power-kern die zelf twee threads kan draaien. Daarnaast bevinden zich op deze chip nog acht gespecialiseerde kernen. Deze zijn vooral goed in multimediaoperaties. De Cell-processor vormt dan ook het hart van de PlayStation 3. Dezelfde processor kan echter ook via het mainframe gebruikt worden. Denk daarbij aan het draaien van virtuele werelden als Second Life.
Maar ook de Xbox 360 van Microsoft en de Wii van Nintendo zijn op de Power-technologie gebaseerd. De Xbox, die voorheen een Intel-processor bevatte, is nu voorzien van een op de PowerPC gebaseerde processor. Deze Xenon bevat drie kernen met elk twee threads, en wordt speciaal voor Microsoft gefabriceerd door de Chartered foundry. Ook de Broadway-chips in de Wii-console zijn speciaal voor dit systeem ontwikkeld.