De storing bij de websites en online producten van Sdu Uitgevers is bijna voorbij. Tijdens geplande onderhoudswerkzaamheden in het datacentrum van Colt afgelopen weekeinde ontstonden problemen met de interconnectiviteit van systemen. Onder de getroffen websites was die van de salarisverwerkingsoftware-tak van Sdu. De divisie Sdu Information Services, die it-diensten levert aan overheden, zou geen problemen hebben gekend.
Datacentrumexploitant Colt sloot in augustus 2009 een vijfjarig miljoenencontract met Sdu. Daarbij werd afgesproken dat Colt de data-opslagomgeving van Sdu zou overnemen, vernieuwen en beheren. Afgelopen weekeinde ging het bij geplande routinewerkzaamheden – patching in de gevirtualiseerde omgeving van Sdu – mis. Nadat de Sdu-omgeving een tijdje uit de lucht was geweest reageerden na de patch applicaties bij het terugzetten anders dan verwacht, vertelt Ed Schravesande, directeur grootzakelijke markt van Colt. 'We hebben de 'root calls' bekeken en een aantal aanpassingen in de VMware-config doorgevoerd. Daarna hebben we in overleg met Sdu gekozen voor het gefaseerd terugzetten van applicaties. Hierbij gaf Sdu aan welke online-producten en websites prioriteit hadden.'
Door de storing waren verschillende websites van bladen uit de lucht, evenals een aantal bedrijfs- en productsites, waaronder die van Sdu Salaris Office SSO (een salarispakket voor het mkb). Bij sommige sites en online producten waren de problemen in het weekeinde al opgelost; bij andere pas vandaag of vanavond.
De storing zou geen gevolgen hebben gehad voor de dienstverlening van het onderdeel Sdu Information Solutions. Dat onderdeel levert e-diensten aan overheden, maar beheert zijn systemen op een andere plek dan in het Colt-datacentrum. Navraag bij de helpdesk leert dat er geen klachten van klanten meer geregistreerd stonden.
Ontevreden
Sam van Oostrom, directeur Sdu Uitgevers, vertelt dat er afgelopen zaterdag een 'negatieve kettingreactie ontstond in de interconnectiviteit van de systemen. De problemen leverden lege url's op. Gelukkig was er een goede backup; de data zelf liepen geen gevaar.'
'De storing is vrijwel opgelost. Ik verwacht in de komende uren dat alle systemen weer 'up and running' zijn', vervolgt hij. 'Daarna gaan we samen met Colt analyseren wat er precies is gebeurd en er wordt extra aandacht besteed aan testen en hertesten.' Van Oostrom wil zich nog niet uitlaten over een eventueel in te dienen schadeclaim bij Colt. 'Dat bespreek ik met Colt na de analyse. Maar dat het om een grote storing gaat en ik ontevreden ben over de gang van zaken moge duidelijk zijn.'
Heeft deze datacentrumexploitant wel eens vanOTAP of Change Management gehoord? Snel uitwijken of snel herstellen zijn onder andere twee sterke kanten van virtualisatie. Hoe kan dat ze hier geen gebruik van konden maken? Of misschien zijn deze zaken juist overgeslagen om een goedkoop SLA aan te kunnen bieden en vervolgens de klant binnen kunnen halen!
‘Root Calls’? bedoelen we niet ‘Root Cause’ ? Hoe lang heeft het incident nu echt geduurd ? twee hele dagen ?