Naar welk platform en welk marktsegment je ook kijkt, de migratie naar het pc-platform was de afgelopen jaren een absolute trend. De inzetbaarheid van die zogenaamde goedkope standaardhardware blijkt echter beperkt. Bedrijven zoeken naar specifieke hardware met meer efficiëntie en hogere prestaties.
De afgelopen jaren is er veel geschreven over alle hardware die zich naar systemen gebaseerd op de standaard pc- en x86-architectuur beweegt. Een bedrijf als SGI (Silicon Graphics) heeft het afgelopen decennium zijn hpc-(high performance computing) en visualisatie-inkomsten zien verdampen als gevolg van deze trend. Tegenwoordig worden animatiefilms en special effects bijvoorbeeld niet meer 'uitgerekend' op de machines van SGI maar op 'renderfarms' gebouwd van Linux-pc's.
Horizontaal schaalbaar
Sun is een ander voorbeeld van een platform-leverancier die zijn traditionele markt verloren ziet gaan. Grote risc-gebaseerde Unix-servers worden vervangen door een of meerdere x86-systemen. Oracle is het beste voorbeeld van een softwareleverancier die zijn verticaal schaalbare database-server naar een meer horizontaal schaalbare vorm heeft weten om te zetten. De rac-architectuur (rac = real application clusters) is inmiddels uitgegroeid tot hun voorkeursplatform.
Maar ook in de high-end markt doet deze ontwikkeling zich voor. IBM gebruikt Linux om de levensduur van zijn mainframes te verlengen. Unisys verkoopt tegenwoordig Linux op Xeon-processoren. En bij HP denkt men na over blade-gebaseerde clusters als vervanging van de Superdome-systemen. Kijken we tenslotte naar de markt voor supercomputers, dan zien we dat de Top 500 van de snelste systemen ter wereld op dit moment gedomineerd wordt door rekenclusters op basis van AMD's Opteron processoren.
Blades
Ondanks alle standaardisatie, consolidatie en rationalisatie, kunnen we echter ook een tegengestelde beweging constateren. De blades zijn daarvan wel het beste voorbeeld. Ondanks dat ze een platform bieden gebaseerd op de pc-architectuur, is de hardware volledig gesloten ('proprietary'): chassis, voedingen, ventilatoren, moederborden, management-modules, netwerk-modules, uitbreidings-slots en -kaarten zijn per fabrikant verschillend. HP en IBM, maar ook kleinere spelers als Sun, Dell en Supermicro, leveren allemaal hun eigen 'form factor' (behuizingsstandaarden). In navolging van deze serverleveranciers lijkt ook netwerkleverancier Cisco binnenkort met eigen serverblades op de markt te komen.
Parallelle rekentaken
Wat meer verborgen voor de beheerders van traditionele infrastructuur, is de opkomst van grafische processors (gpu's: graphics processing units) voor de uitvoering van parallelle rekentaken. Denk daarbij aan financiële en risico-analyses ('Monte Carlo'-berekeningen), de verwerking van signalen en meetgegevens, en hpc-toepassingen in wetenschap en engineering.
De grap is dat leveranciers van grafische processoren deze kans pas zagen toen eindgebruikers zelf al met grafische processoren aan het rekenen waren geslagen. Zo waren er onderzoeksgroepen aan universiteiten die een hele stapel PlayStations neerzetten vanwege de razendsnelle Cell-processor die daarin zit. Inmiddels biedt IBM de Cell Broadband Engine echter ook in de vorm van een blade aan. Door tientallen van die rekenmodules in een rek te stoppen, kunnen voor relatief weinig geld grote rekenclusters worden gebouwd.
Grafische processor
nVidia biedt iets dergelijks aan op basis van dezelfde grafische processoren die van origine in hun videokaarten zitten. Hun Tesla-productlijn richt zich specifiek op wat inmiddels gpgpu heet: General-Purpose Computing on GPU. De basis onder deze reeks is de C1060 module, met daarin een grafische processor met 240 kernen en een ingebouwde 'thread manager'. De pci-insteekkaart bevat echter geen video-uitgang maar is puur bedoeld voor parallel rekenwerk. Daartoe is elke kaart voorzien van vier Gigabyte aan lokaal geheugen. Voor de programmering van deze specifieke hardware stelt nVidia de cuda-ontwikkelomgeving (cuda = compute unified device architecture) beschikbaar.
Ook nu kunnen weer grotere systemen gebouwd of gekocht worden door deze rekenkaarten te stapelen. nVidia zelf verkoopt bijvoorbeeld een systeem (de S1070) waarin vier gpu's zijn gecombineerd in één rack-mounted 'pizza box'. De Tesla Personal Supercomputer bevat ook weer vier gpu-modules, maar nu ingeprikt op een klassiek server-systeem. Vergelijkbare configuraties zijn ook bij andere leveranciers beschikbaar. De Cray CX1 bijvoorbeeld is een blade-systeem volgens de Intel Cluster Ready specificaties. De normale Xeon blades kunnen via extra pci-slots echter worden uitgebreid met video- en rekenmodules van nVidia voor visualisatie en hpc-toepassingen. Maar ook zelf bouwen is op basis van de C1060 modules prima te doen.
Java-werklasten
Een laatste naam die we in dit verband willen noemen, is Azul Systems. Dat bedrijf richt zich met eigen hardware en software specifiek op de zware Java-werklasten. Denk dan vooral aan grote zakelijke applicatie-servers. Niet voor niets is Azul recordhouder voor het grootste aantal 'business operations per second' (bops).
De hardware van het bedrijf is volledig proprietary. De zelf ontwikkelde en door TMSC geproduceerde Vega-processor ligt aan de basis van de systemen. De laatste 7300 serie bevat maar liefst tot achttien Vega 2 chips, die elk weer goed zijn voor 48 kernen. Dat brengt het totaal aantal rekenkernen van hun topmodel op 864. En dat alles in een 14U hoog chassis.
Bovenop deze systemen draait Azul zijn eigen jvm: Azul Virtual Machine (AVM). Deze zorgt voor de executie van de Java-werklasten die door de originele applicatie-server naar de Java Compute Appliance worden doorgezet voor verwerking. Het geheim van de Azul-systemen zit 'm in de veel grotere parallellisering van de applicaties en een veel sneller geheugenbeheer.
Speedup
De nieuwe hardware die we hier hebben beschreven, speelt in op behoeften die standaard pc-systemen niet in kunnen vullen. Zo danken de blades hun bestaansrecht aan de vraag naar grotere dichtheden (high-density systemen), met een grotere efficiëntie vanwege gedeelde voeding, koeling en I/O. Bovendien biedt deze 'form factor' leveranciers de mogelijkheid zich weer van elkaar te onderscheiden (en een nieuwe lock-in van hun klanten te creëren).
De Java-appliances van Azul en gpgpu leveren prestaties die met standaardhardware (cots = Commercial Off-The-Shelf) simpelweg niet haalbaar zijn (of niet tegen vergelijkbare kosten). Om een idee te geven: Azul garandeert een speedup van vijf tot vijftig keer. En ook voor gpgpu (General-Purpose Computing on GPU) worden regelmatig prestatieverbeteringen van twee orden van grootten gemeld. Juist vanwege dit soort grote verschillen zal er altijd een markt blijven voor specifieke hardware en systemen.
Welk systeem er ook gebruikt wordt, het hergebruiken is nog altijd het meest kosten effectief.