Onlangs was ik betrokken bij een dochterbedrijf van Candle dat IBM’s MQ-software naar de Tandem Guardian heeft gepoort. Een boeiend aspect van deze exercitie was dat weer eens bleek dat de architectuur van Tandem echt uniek is; geen van de standaard broncode-modellen van IBM paste netjes op de Tandem-machines.
De meeste organisaties gebruiken Tandem nu voor fouttolerantie. Dit wordt gerealiseerd door een krachtig softwareconcept, gebaseerd op watchdog timers. Elk proces wordt twee keer opgestart, telkens op een verschillende combinatie van processor, geheugen en I/O-subsysteem in de machine. Eén proces is actief, de andere sluimert. Het secundaire proces blijft maar een beperkte tijd sluimeren. Na die tijd wordt het automatisch geactiveerd. Het actieve proces moet daarom regelmatig ‘OK’-berichten naar het secundaire proces sturen; hierdoor wordt de timer op nul gezet en blijft het secundaire proces ook daadwerkelijk sluimeren. Dit is erg efficiënt en in combinatie met geclusterde disk-controllers, dubbele schijven, enzovoort, een zeer bevredigende oplossing voor applicaties die een hoge mate van betrouwbaarheid vereisen.
Tandem heeft ook Unix op de fouttolerante hardware gezet, maar met veel minder succes, vooral omdat Unix van nature geen robuust systeem is en de overdraagbaarheid lastig bleek te zijn. In elk geval kwam deze combinatie direct te concurreren met robuuste systemen van IBM, HP en Digital. In tegenstelling tot de Guardian zijn die geen van alle echt fouttolerant, maar wel betrouwbaar genoeg voor tal van applicaties. De aanwezigheid van Unix deed Tandem echter geen kwaad, ook al was het geen succes.
Tandem ontwikkelde ook een uitstekend relationeel dbms, Non-stop SQL, dat optimaal gebruik maakte van de veilige Tandem-software. Net als alle andere rdbms-producten had dit systeem een commit in twee fasen. Dit is noodzakelijk om meerdere databases op verschillende machines consistent te kunnen houden. In tegenstelling tot veel andere rdbms-producten werkte het systeem echter betrouwbaar; misschien was het wel het enige succesvolle on-line gespreide transactie-databasesysteem, gewoon door de combinatie van twee-fasen commit en fouttolerante hardware.
In sommige opzichten lijken de Tandem-systemen op IBM’s AS/400, in de zin dat ze inherent compleet zijn. Ze hebben hun eigen database, programmeertools, beheerfuncties, communicatie en dergelijke. Unix daarentegen biedt een groot scala aan server-producten; dit betekent dat het zeer onwaarschijnlijk is dat twee Unix-systemen onderling uitwisselbaar zijn, omdat het ene systeem bijvoorbeeld Oracle gebruikt en het andere systeem Sybase. Merk op dat Microsoft (en IBM wellicht ook) een vergelijkbare benadering volgen door de servers met de besturingssystemen mee te leveren. Hiermee wordt gepoogd op hoog niveau een gemeenschappelijke api voor applicaties te creëren. Desondanks bieden alleen de AS/400 en de Tandem Guardian op dit moment echte applicatieportabiliteit, maar dan alleen naar een andere AS/400, respectievelijk Guardian!
Net als HP, NCR en Sequent maakt ook Tandem zich zorgen over Windows NT. Ze zijn weliswaar niet zo kwetsbaar als de Unix-leveranciers maar willen toch ook in deze markt aanwezig te zijn, waarbij die activiteit winstgevender moet zijn dan de poging van Unix. NT is een optie maar kan de gespecialiseerde Guardian-systemen nooit vervangen. Tandem’s extreme kennis van geclusterde multiprocessor-systemen kan ze een voorsprong geven op het gebied van fouttolerante NT-omgevingen. Het is zeker iets om in de gaten te houden, nu er clusterbare NT-versies op de markt verschijnen.
Tandem is bijna uitsluitend actief in de financiële sector. Het is altijd verrassend geweest dat ze zo weinig succes hadden in andere betrouwbaarheidsgevoelige sectoren. Zo hadden de transactiegerichte Tandem-machines succesvol kunnen zijn in industriële toepassingen. Het probleem moet hem in een gebrek aan overdraagbare applicaties hebben gezeten; de industrie heeft een voorkeur voor Unix. Pakketten als Triton en R/3 draaien nu echter ook op NT. Dit zou weer nieuwe marktkansen kunnen bieden. In de toekomst zal men afhankelijk zijn van specifieke dbms-producten, zodat er een aanzienlijke inspanning nodig zal zijn om Non-stop SQL te kunnen blijven gebruiken. De beschikbaarheid van NT op Tandem-hardware betekent immers niet automatisch dat Oracle of Informix ook beschikbaar zijn.
Omdat Tandem van oudsher de kampioen van redundante hardware is, heeft het bedrijf veel ervaring met snelle interne netwerken. Dat zijn weer andere dingen dan externe netwerken, zoals Ethernet. Deze hardware-kennis heeft geresulteerd in een uitzonderlijk snelle schakeltechniek met als codenaam Servernet. Servernet-switches zijn goedkoop en kunnen processoren, geheugenelementen en I/O-subsystemen aan elkaar koppelen – dit is een voordeel ten opzichte van de bestaande SMP-architectuur, die een gemeenschappelijk geheugen kent. Naarmate er meer processorcomplexen in clusters worden gekoppeld, met gebruikmaking van kant-en-klare componenten in het algemeen en Windows NT in het bijzonder, zal de Servernet-technologie steeds belangwekkender worden. We moeten deze ontwikkelingen nauwlettend gadeslaan; IBM, HP en Pyramid hebben al belangstelling getoond.