Je kent de kreten vast wel, dat ‘downtime onacceptabel is’. Ook bekend zijn de kostenberekeningen, waaruit blijkt dat het je als bedrijf de kop kan kosten als de ict-voorzieningen gedurende een bepaalde tijd niet beschikbaar zijn. Zo berekende het Ponemon Institute dat de schade per gebeurtenis op kan lopen tot zo’n 625.000 euro per gebeurtenis.
De meeste beheerders van datacenters en computerruimtes hebben dan ook hun voorzorgsmaatregelen getroffen om downtime tot een minimum te beperken. De servers zijn voor power aangesloten op een A- en een B-feed, de uninterruptible power supplies staan in een ‘N+1’-opstelling, zodat het niet erg is als een van de ups’en wegens onderhoud buiten gebruik is en soms is er zelfs diesel op voorraad om de generatoren bij te kunnen tanken. Als een of meerdere servers het begeven, kunnen de getroffen workloads met behulp van virtualisatie vrijwel direct naar een ander deel van het serverpark worden verplaatst, of er wordt capaciteit uit de cloud bijgeschakeld.
Zinloze investeringen
En toch gaat het nog altijd vaak mis. 82 procent van alle datacenters kan dan ook niet het gewenste serviceniveau halen. In een groot deel van de gevallen (47 procent) is menselijk falen de oorzaak van een downtime, zo blijkt uit onderzoek van IDC. Vaak is er dan onvoldoende goed nagedacht over de onderlinge afhankelijkheden, oftewel de impact die een ‘change’ heeft op bijvoorbeeld de stroomvoorziening of de koeling. Dat de informatie die nodig is om deze afhankelijkheden te zien zich verspreid over meerdere systemen bevindt, helpt ook niet echt mee.
Wat ik ook vrijwel wekelijks tegenkom, is dat een volledig redundant design onderuit wordt gehaald door de meest basale ontwerpfouten. Zo is in vrijwel elk datacenter wel een switch met een enkelvoudige poweraansluiting te vinden, waar een hele groep servers van afhankelijk is. De investeringen die zijn gedaan in een redundant ontwerp lijken dan ineens redelijk zinloos.
Holistisch inzicht
Met data center infrastructure management (dcim)-tooling is zo’n switch die de redundante infrastructuur onderuit haalt snel boven water te krijgen. Een dcim-oplossing legt alle lijnen tussen it en facilitair bloot en geeft een holistisch inzicht op het functioneren van het datacenter als organisch geheel. Niet zonder resultaat; een datacenter met gedegen beheer- en recoverystrategie vermindert het gemiddelde aantal outages per jaar van 2,26 naar 0,56. En verkort de gemiddelde duur van negentig naar tien minuten.
Een goede dcim-oplossing biedt de datacentermanager verschillende tools voor bijvoorbeeld capaciteitsmanagement, het monitoren van het netwerk, de power en de koeling en het optimaliseren van de pue. Nog belangrijker dan deze ‘technische instrumenten’ is echter dat dcim datacentermanagers helpt bij het voorkomen van fouten, bijvoorbeeld door het draaien van ‘what-if-scenario’s’ die de consequenties van beslissingen beter inzichtelijk maken. Dat voorkomt foute keuzes die tot uitval leiden.
Verouderde tools
Veel datacentermanagers plannen en beheren het datacenter echter nog altijd met verouderde tools zoals Excel, Visio en Autocad. Deze tools bieden slechts een fragmentarisch zicht op alle activiteiten in het datacenter, en maken in ieder geval niet de onderlinge afhankelijkheden inzichtelijk. Door het ontbreken van een ‘holistisch beeld’ is downtime haast onvermijdelijk.
Geen wonder dat 82 procent van alle datacenters niet het gewenste serviceniveau kan leveren. In een tijdperk waarin we steeds afhankelijker worden van data – en van de datacenters waarin die data worden gehuisvest – is het eigenlijk niet meer acceptabel dat de beheerders worden afgescheept met tools van twintig jaar geleden.